موتور جستجوی گوگل، قدرتمندترین موتور جستجوگر شناخته شده در سطح دنیاست. بسیاری از مردم عملیات سرچ اطلاعات را با مفهموم گوگل میشناسند. وسعت منابع اطلاعاتی و ویژگیهای خاص گوگل به جستجوگران کمک میکند تا دقیقا همان چیزی را که میخواهند پیدا کنند. این اطلاعات شامل عکس، صفحات وب، فیلم و بسیاری از اطلاعات دیگر میباشد.
افراد مختلف با توجه به نیاز خود از جمله کسب اطلاعات، خرید اینترنتی و رسیدن به پاسخ سوالات خود از این موتور جستجو استفاده میکنند. با وجود بیش از 30 موتور جستجوگر وب، اکثریت مردم از طریق گوگل به جستجوی خود میپردازند. طبق جامعه آماری، 90% جستجوی وب از طریق Google اتفاق میافتد. (تقریبا 20 برابر Bing و Yahoo). پس حتما میتوانید اهمیت سئو سایت برای موتور جستجوی گوگل را درک کنید.
حال سوالی که مطرح میشود، این است که نحوه عملکرد موتور جستجوی گوگل چگونه است؟ و رتبه بندی سایت های مختلف، چگونه انجام میشود؟
اگر شما نیز کنجکاو هستید تا بدانید نحوه کارGoogle چگونه است، با تاپسئو همراه باشید تا پاسخ این سوالها را بررسی کنیم.
گوگل یکی از هوشمندترین موتورهای جستوگر در دنیاست؛ این موتور هوشمند با توجه به الگوریتمهای خود جایگاه کلمات کلیدی در صفحات SERP را مشخص میکند. در واقع گوگل محتوای نوشته شده در سایت شما را ابتدا کشف، سپس درک و در نهایت نسبت به دیگر رقبای شما سازماندهی میکند، تا بهترین نتیجه نسبت به نیاز کاربر را نشان دهد.
موتور جستجوی گوگل چگونه عمل میکند؟
موتورهای جستجو سه علکرد اصلی در هنگام بررسی یک سایت دارند:
– خزش (crawl)
– ایندکس (index)
– رتبه بندی (rank).
-
خزش (Crawl) – خزش در موتور جستجوی گوگل به چه معناست؟
عمل خزش همان مرحله کشف برای گوگل میباشد. بهطور مثال؛ زمانی که شما در سایت خود مقاله جدیدی ایجاد مینمایید، در واقع لینک جدیدی برای وبسایت خود ساخته اید. موتور جستجوی گوگل از طریق رباتهای خزش خود که به عنکبوت نیز معروف هستند، شروع به خزیدن در صفحات و سایت مپ شما میکند. در واقع گوگل رباتهای خود را جهت پیدا کردن صفحات جدید و بروز شده ارسال مینماید. گوگل از طریق عمل خزش، اطلاعات موجود در این صفحات را بررسی و جمع آوری نموده و در عین حال، تمامی لینک های موجود در آن صفحه را نیز مورد بررسی و تحلیل خود قرار میدهد. این اطلاعات و محتواها میتواند شامل عکس، فیلم،یک صفحه وب، pdf، و غیره باشد. مدیران وب سایتها از طریق گوگل وب مستر تولز(Google Search Consol Tools) میتوانند تعداد دفعات خزش واینکه کدامین صفحات مورد خزش قرار بگیرند یا نشوند را مشخص نمایند.
-
ایندکس (index) – ایندکس صفحات به چه معناست؟
بعد از فرآیند پردازش اطلاعات و کرول توسط گوگل، URL های شما از طریق گوگل فهرست و در صفحات موتورجستجوی گوگل نشان داده میشوند. اصطلاحا به این عمل ایندکس میگویند.
تمامی محتویات کشف شده توسط موتور جستجوی گوگل، درپایگاه داده عظیمی به نام Caffeine ، که مجموعه ای بزرگ از URL های کشف شده است، دخیره میشود. حجم اطلاعات این پایگاه داده به قدری گسترده و عظیم است که بهراحتی میتواند بهترین پاسخ را به کاربر جستجو کننده نمایش دهد.
در واقع اگر محتوایی در سایت خود درج کنید و عمل ایندکس بر روی آن صورت نگیرد، زحمات شما بی نتیجه خواهد ماند. برای ایندکس شدن مطالبتان، ربات های جستجوگر گوگل نیاز به دسترسی به url های شما دارند. اگر میخواهید بدانید کدامین صفحات سایت شما در موتور جستوی گوگل ایندکس شده اند، میتوانید از ابزار سرچ کنسول استفاده نمایید.
در صورت عدم دسترسی به سرچ کنسول، با استفاده از دستور زیر میتوانید متوجه ایندکس شدن url مد نظر خود بشوید: Site: url
چگونه به گوگل بگوییم کدامین صفحات سایت ما را خزش کند؟
به عنوان یک مدیر وبسایت ابتدا باید صفحات مهم خود را از صفحات دیگر تفکیک کنید. قطعا در وبسایت خود صفحاتی دارید که نمیخواهید به هر دلیلی در صفحات موتور جستجوی گوگل نشان داده شوند.
در واقع یک سری صفحات فقط برای کاربر تهیه میشوند و نیاز است در ساختار یک سایت باقی بمانند، ولی به گوگل نشان داده نشوند. یا یک سری از صفحات بی ارزش در سایت وجود دارند که نیاز به دسترسی گوگل به این صفحات نیست. در اینصورت باید دسترسی کرول گوگل برای این صفحات را ببندید، تا به سئو سایت شما آسیبی وارد نشود.
نحوه دسترسی ربات های گوگل از طریق فایل Robot.txt انجام میشود. با استفاده از تگهای نوایندکس و نوفالو دسترسی و خزش را برای ربات های جستجوگر محدود میکنیم.
فایل Robot.txt چیست؟ – کاربرد فایل Robot.txt در سئو سایت
محدودیت دسترسی ربات های گوگل یا همان Googlebot ، از طریق فایل Robot.txt مشخص میشود. Robot.txt یک فایل متنی ساده است که در روت دایرکتوری (Root Directory) قرار میگیرد.
نحوه برخورد Googlebot با فایل Robot.txt چگونه است؟
ربات موتور جستجوی گوگل، در ابتدای ورود خود به یک سایت به دنبال این فایل میگردد.
- در صورت پیدا نکردن فایل txt تمامی صفحات آن سایت را مورد خزش خود قرار میدهد.
- در صورت دسترسی به txt، از دستورات داخل آن فایل پیروی کرده و به صفحاتیکه توسط این فایل برای رباتهای گوگل بسته شده اند کاری ندارد. البته توجه نمایید که تمامی رباتهای گوگل از این فایل ممکن است پیروی نکنند. از جمله ربات هایی که قصد بررسی امنیت و ایمنی سایت را دارند.
- در صورتیکه Googlebot در هنگام دسترسی به فایل txt یک سایت با خطا مواجه شود، آن سایت را خزش نمیکند.
اهمیت بهینه سازی بودجه خزش (Crawl Budget)
بودجه خزش، به تعداد صفحاتی که رباتهای موتور جستجوی گوگل، طی یک دوره زمانی مشخص در سایت شما ایندکس میکنند، گفته میشود. نحوه تخصیص این بودجه بر اساس بزرگی یک سایت و تعداد لینکهای ورودی به آن مشخص میشود. موتور جستجوی گوگل (Google) با استفاده از دو فاکتور Crawl Limit و Crawl Demandبودجه خزش هر سایت را محاسبه مینماید. در نتیجه بهینه سازی نرخ خزش اهمیت بسیاری دارد. برای آن که بودجه خزش شما برای صفحات غیر مهم هدر نرود، دسترسی به صفحات کم ارزش را برای رباتهای گوگل ببندید. از جمله، محتوای تکراری (Duplicate) ، لینکهای شکسته، محتوای بیکیفیت و …
-
رتبه بندی (rank) – نحوه رتبه بندی صفحات در گوگل چگونه است؟
بعد از عمل خزش و ایندکس صفحات، گوگل براساس معیارهایی که دارد، رتبه و جایگاه مربوط به صفحات شما را مشخص مینماید. در اینجاست که عمل سئو بر روی یک سایت معنا و مفهوم خود را نشان میدهد. در صورت رعایت نکات سئو و تولید محتوای با کیفیت و ارزشمند صفحات شما به مرور رشد و در جایگاه مناسبی قرار خواهند گرفت. در واقع در هنگام ایجاد یک Query (عبارت جستجو) توسط کاربر، موتور جستجوی گوگل، به URLهای ایندکس شده خود رجوع و مرتبط ترین محتوا را بر اساس عبارت سرچ کاربر رتبه بندی و نشان میدهد. به ترتیب قرار گیری صفحات در نتایج گوگل Rnking نیز میگویند.
جمع بندی
تا اینجا با سه فرآیند اصلی گوگل آشنا شدید. به طور خلاصه صفحات جدید در صورت دسترسی دادن به رباتهای گوگل، ابتدا توسط عنکبوت جستجوگر شناسایی و خزش میشود، سپس در فهرست مطالب و پایگاه اطلاعاتی جستجوی گوگل قرار گرفته، و براساس معیارهای گوگل، از جمله ارزش وبسایت و محتوای ارزشمند و نکات سئو، بسته به نوع عبارات جستجو، رتبه بندی میشوند. در نتیجه یکی از کارهای مهمی که باید در ابتدا انجام دهید تایین صفحاتی است که به هر دلیل نمیخواهید به گوگل نشان دهید. بعد از آن مطمئن شوید، صفحات دیگر شما در دسترس رباتهای گوگل قرار میگیرند تا فرآیند خزش بر روی آنها انجام شود، در غیر اینصورت زحمات شما بینتیجه خواهد ماند.
تیم تاپ سئو با بهرهگیری از نیروهای متخصص و مجرب، مسلط به مفاهیم الگوریتم و ساختارهای موتور جستجوی گوگل، در جهت ارتقاء جایگاه سایت شما در صفحات گوگل, اماده همکاری با شماست.
جهت مشاوره و سفارش سئو، با کارشناسان ما در ارتباط باشید.
۴ دیدگاه. دیدگاه تازه ای بنویسید
سلام. ببخشید از کجا باید متوجه بشیم که فایل robot.txt مون درست عمل مینکه و رباتهای گوگل اون رو پیدا میکنند و به مشکل نمیخورند؟
سلام محبوبه عزیز
ممنون که این مقاله رو مطالعه کردی. ببین خود گوگل میتونه فایل robot.txt رو تست کنه. کافیه وارد لینک زیر بشی و بعد گزینه open robot.txt tester رو بزنی.
بازم اگه سوالی داشتی حتما بپرس.☘
موفق باشی
مطلب بسیار خوبی بود اما فک میکنم میتونست پخته تر از این هم به اصطلاحات تخصصی اشاره بشه ولی در کل بسیار ساده مفاهیم رو توضیح داده بودین و این نکته بسیار ارزشمندی بود و باعث شد مقاله رو انتها با دقت بخونم
سلام مریم عزیز
ممنون از نظرت. کاملا درسته. این مفاهیم هر کدوم خودشون به تنهایی می تونن یک مقالهی دیگه باشن.
حتما در آینده به بسط این موضوعات هم میپردازیم.
موفق باشی