خیلی وقت ها افرادی که در سایت های خود محتوا فارسی تولید میکنند. به این نکته بر میخورند که ادرس نوشته ی خودشون رو (url) فارسی بنویسند یا انگلیسی.
جواب این سوال که ایا url های صفحات باید انگلیسی باشند یا خیر را از زبان جان مولر، تحلیل گر وب مستر، بشنوید.
Today's question comes from John, from Switzerland-- that's me.
My question-- so can URLs use local non-English words?
For sites that target users outside of English-speaking regions, it's sometimes unclear, if they can really use their own language for URLs.
And if so, what about non-English characters?
Google Search uses URLs primarily as a way to address a piece of content.
We use URLs to crawl a page, which is when Googlebot goes to check the page and to use the page's content for our search results.
As long as URLs are valid and unique, that's fine.
For domain names and top level domains, non-Latin characters are represented with punycode encoding.
This can look a little bit weird, at first.
For example, if you take Mueller-- my last name—with the dots on the U, that would be represented slightly differently as a domain name.
For browsers, and for Google Search, both versions of the domain name are equivalent.
We treat them as one in the same. The rest of the URL can use
Unicode,UTF-8, encoding for non-Latin characters.
You can use either the
[INAUDIBLE] version or the Unicode version with your website.
They are also equivalent to Google.
Regardless of what you place within your URLs, make it easy for folks to link to your pages.
For example, avoid using spaces, commas, and other special characters in the URL.
They work for Google, but they make linking a little bit harder.
Use dashes to separate words in your URL
Some prefer using underscores-- that's fine, too.
Dashes are usually a little bit easier to recognize.
And if your site is available in multiple languages, use the appropriate language in URLs for content in that language
So to sum it up-- yes, non-English words in URLs are fine.
We recommend using them for non-English websites.
Check out the links below, and don't forget, you can drop by our [INAUDIBLE].
متن ویدئو به زبان فارسی:
سوال امروز از جان از سوییس است – این منم (او هم نامش جان و اهل سوییس است)
آیا آدرس صفحات می تواند شامل لغات غیر انگلیسی باشد؟
برای سایت هایی که کاربران غیر انگلیسی زبان را هدف قرار می دهند ممکن است مشخص نباشد که آیا ان ها می توانند از لغات زبان خودشان در آدرس صفحات استفاده کنند. و اگر می توانند، برای کاراکتر های غیر انگلیسی چه کاری انجام دهند؟
جستوجوی گوگل از آدرس صفحات به عنوان اولین راه برای ارجاع به مطالب استفاده می کند.
ما از آدرس صفحات برای کراول کردن صفحات استفاده می کنیم. که به معنای وقتی است که ربات گوگل به صفحه ای سر میزند تا از محتوای آن برای نتایج جستجو استفاده کند.
تا جایی که آدرس صفحات معتبر و یکتا باشند، همه چیز خوب است.
برای نام دامنه ها و دامنه های لول بالا، کاراکتر های غیر لاتین به صورت پیونی کد (Punycode) کد گذاری می شوند
این مساله ممکن است اول کمی عجیب به نظر برسد.
به عنوان مثال اگر ما نام خانوادگی من Mueller را با دو نقطه روی حرف U در نظر بگیریم. به عنوان نام دامنه کمی متفاوت نمایش داده خواهد شد.
برای مرورگرها و جستجوی گوگل هر دو ورژن نام دامنه یکسان خواهد بود.
ما آن ها را به صورت یکسان در نظر میگیریم. بقیه آدرس صفحات می توانند از Unicode و UTF-8 برای کاراکتر های غیر انگلیسی استفاده کنند.
شما می توانید هم ورژن scaped و هم ورژن یونی کد را در سایتتان استفاده کنید.
آن دو نیز از نظر گوگل یکسان هستند.
جدا از اینکه شما چه چیزی را در آدرس صفحه قرار می دهید سعی کنید لینک دادن به صفحاتتان را برای دیگران آسان کنید.
به عنوان مثال از فاصلا یا کاما یا سایر کاراکتر های خاص در آدرس صفحات استفاده نکنید.
این کاراکتر ها برای گوگل مشکلی ایجاد نمی کنند اما لینک دادن به آن ها کمی سخت تر می شود.
از دش برای جدا کردن لغات یو آر ال استفاده کنید. بعضی از افراد ترجیح میدهند که از underscore استفاده کنند.
استفاده از آن نیز مشکلی ندارد.
اما دش ها معمولا کمی راحت تر شناخته می شوند.
و اگر سایت شما به زبان های مختلف موجود است، زبان مناسب را در آدرس صفحات محتوای آن زبان استفاده کنید.
در نتیجه، بله استفاده از لغات غیر انگلیسی در آدرس صفحات مشکلی ندارد.
ما استفاده از آن ها را برای سایت های غیر انگلیسی پیشنهاد می کنیم.