InternetSearch Engine Optimization

Mengindeks laman dalam enjin carian. Bagaimana pengindeksan tapak dalam "Yandex" dan "Google"

Apakah pengindeksan tapak? Bagaimana ia berlaku? Anda boleh mencari jawapan kepada soalan-soalan ini dan lain-lain dalam artikel. Pengindeksan web (pengindeksan di enjin carian) merujuk kepada proses membawa maklumat tentang tapak ke pangkalan data oleh robot enjin carian, yang kemudiannya digunakan untuk mencari maklumat mengenai projek web yang telah meluluskan prosedur sedemikian.

Data pada sumber web sering mengandungi kata kunci, artikel, pautan, dokumen. Pengindeksan juga boleh audio, imej dan sebagainya. Adalah diketahui bahawa algoritma untuk mengenalpasti kata kunci bergantung kepada perkakas carian.

Jenis maklumat yang diindeks (fail flash, javascript) terdapat beberapa batasan.

Pengurusan persetubuhan

Mengindeks laman web adalah proses yang kompleks. Untuk mengurusnya (sebagai contoh, untuk melarang kemasukan halaman tertentu), anda perlu menggunakan fail robots.txt dan arahan seperti Allow, Disallow, delay-delay, User-agent dan lain-lain.

Juga, tag dan props yang menyembunyikan kandungan sumber dari robot Google dan Yandex (Yahoo menggunakan tag digunakan untuk mengindeks.

Di laman web Goglle mesin carian diindeks dari beberapa hari hingga satu minggu, dan di Yandex - dari satu minggu ke empat.

Adakah anda mahu tapak anda muncul dalam pertanyaan hasil enjin carian? Kemudian ia perlu diproses oleh "Rambler", "Yandex", Google, Yahoo dan sebagainya. Anda mesti memberitahu enjin carian (labah-labah, sistem) tentang kewujudan laman web anda, dan kemudian mereka akan mengimbasnya secara keseluruhan atau sebahagiannya.

Banyak tapak tidak diindeks selama bertahun-tahun. Maklumat yang ada pada mereka tidak dapat dilihat oleh sesiapa, kecuali pemiliknya.

Cara pemprosesan

Mengindeks laman boleh dilakukan dengan beberapa cara:

  1. Pilihan pertama ialah menambah secara manual. Anda perlu memasukkan data tapak anda melalui borang khas yang ditawarkan oleh enjin carian.
  2. Dalam kes kedua, robot carian sendiri mendapati laman web anda dengan pautan dan indeksnya. Dia boleh menjejaki tapak anda untuk pautan dari sumber lain yang membawa kepada projek anda. Kaedah ini paling berkesan. Jika enjin gelintar mencari tapak dengan cara ini, ia menganggapnya penting.

Masa

Mengindeks laman web tidak terlalu pantas. Terma adalah berbeza, dari 1-2 minggu. Pautan dari sumber yang berwibawa (dengan PR dan Titz yang sangat baik) dengan ketara mempercepat penempatan tapak dalam pangkalan data enjin carian. Hari ini Google dianggap paling lambat, walaupun sehingga 2012 dia boleh melakukan kerja ini selama seminggu. Malangnya, semuanya berubah dengan cepat. Adalah diketahui bahawa Mail.ru berfungsi dengan laman web di kawasan ini selama kira-kira enam bulan.

Mengindeks laman dalam enjin carian tidak boleh dilakukan oleh setiap pakar. Masa untuk menambah halaman baru ke pangkalan data tapak yang telah diproses oleh enjin carian dipengaruhi oleh kekerapan mengemaskini kandungannya. Jika sumber sentiasa dikemas kini, sistem mendapati ia sering dikemas kini dan berguna untuk orang ramai. Dalam kes ini, kerjanya dipercepat.

Anda boleh mengikuti perkembangan pengindeksan tapak pada bahagian khas untuk webmaster atau pada enjin carian.

Perubahan

Oleh itu, kami telah mengetahui bagaimana tapak diindeks. Perlu diingatkan bahawa pangkalan data enjin carian sering dikemas kini. Oleh itu, bilangan halaman projek anda yang ditambah kepada mereka boleh berubah (kedua-dua pengurangan dan kenaikan) atas sebab-sebab berikut:

  • Enjin carian sekatan ke laman web ini;
  • Kehadiran kesilapan di laman web ini;
  • Perubahan algoritma enjin carian;
  • Menjijikkan hosting (tidak dapat diakses pelayan di mana projek terletak) dan sebagainya.

Jawapan Yandex kepada soalan biasa

Yandex adalah mesin carian yang digunakan oleh banyak pengguna. Ia berada di kedudukan kelima di antara sistem carian dunia dengan jumlah permintaan penyelidikan yang diproses. Sekiranya anda menambah tapak kepadanya, ia boleh ditambah ke pangkalan data terlalu lama.

Menambah URL tidak menjamin pengindeksannya. Ini adalah salah satu kaedah yang membolehkan robot sistem dimaklumkan bahawa sumber baru telah muncul. Jika laman web tidak mempunyai pautan dari laman web lain atau tidak banyak daripada mereka, penambahan akan membantu untuk mencarinya lebih cepat.

Jika pengindeksan tidak berlaku, anda perlu menyemak sama ada kegagalan pada pelayan apabila aplikasi dibuat dari robot "Yandex". Sekiranya pelayan melaporkan ralat, robot akan menyelesaikan tugasnya dan cuba melaksanakannya dalam susunan pusingan komprehensif. Pekerja "Yandex" tidak dapat meningkatkan kelajuan menambah halaman ke enjin gelintar pangkalan data.

Mengindeks laman dalam "Yandex" adalah tugas yang sukar. Anda tidak tahu bagaimana menambah sumber kepada enjin carian? Jika ia mempunyai pautan dari laman web lain, maka anda tidak perlu menambahkan tapak khusus - robot akan secara automatik mencari dan mengindeksnya. Jika anda tidak mempunyai pautan tersebut, anda boleh menggunakan borang "Tambah URL" untuk memberitahu enjin carian tentang kewujudan laman web.

Ingat bahawa menambahkan URL tidak menjamin indeksasi penciptaan anda (atau kelajuannya).

Ramai orang tertanya-tanya berapa lama lamanya untuk indeks laman web di Yandex. Pekerja syarikat ini tidak memberikan jaminan dan tidak meramalkan istilah. Sebagai peraturan, sejak robot mengetahui tentang tapak tersebut, halamannya muncul dalam pencarian dalam dua hari, kadang-kadang dalam beberapa minggu.

Proses pemprosesan

Yandex adalah enjin carian yang memerlukan ketepatan dan perhatian. Laman pengindeksan terdiri daripada tiga bahagian:

  1. Crawlers merangkak laman sumber.
  2. Kandungan (kandungan) tapak dicatatkan dalam pangkalan data (indeks) sistem carian.
  3. Selepas 2-4 minggu, selepas mengemaskini pangkalan data, anda dapat melihat hasilnya. Laman anda akan muncul (atau tidak akan muncul) dalam SERP.

Semak Pengindeksan

Bagaimana untuk memeriksa pengindeksan tapak? Anda boleh melakukan ini dengan tiga cara:

  1. Masukkan nama syarikat anda di bar carian (contohnya, "Yandex") dan periksa setiap pautan pada halaman pertama dan kedua. Jika anda mencari URL idea anda di sana, maka robot itu memenuhi tugasnya.
  2. Anda boleh memasukkan URL tapak anda dalam rentetan carian. Anda boleh melihat berapa banyak halaman Internet dipaparkan, iaitu, diindeks.
  3. Daftar pada halaman webmaster di Mail.ru, Google, Yandex. Setelah anda melalui pengesahan tapak, anda dapat melihat hasil pengindeksan, dan perkhidmatan enjin carian lain yang dibuat untuk meningkatkan kinerja sumber daya anda.

Mengapa Yandex enggan?

Mengindeks laman web di Google adalah seperti berikut: robot dalam pangkalan data merekodkan semua halaman laman web, kurang baik dan kualitatif, tanpa memilih. Tetapi hanya dokumen berguna yang terlibat dalam ranking. Dan Yandex mengecualikan semua barangan web dengan segera. Dia boleh indeks halaman mana pun, tetapi enjin carian akhirnya akan menghilangkan semua sampah.

Kedua-dua sistem mempunyai indeks tambahan. Kedua-dua halaman yang berkualiti rendah itu mempengaruhi kedudukan laman web keseluruhannya. Falsafah mudah berfungsi di sini. Sumber yang disukai pengguna tertentu akan menduduki kedudukan yang lebih tinggi dalam penerbitannya. Tetapi individu yang sama dengan kesulitan akan mendapati tapak yang dia tidak suka kali terakhir.

Itulah sebabnya, pada mulanya adalah perlu untuk menutup salinan dokumen web dari pengindeksan, untuk memeriksa kehadiran halaman kosong dan tidak mengeluarkan kandungan berkualiti rendah.

Percepatan kerja Yandex

Bagaimanakah saya boleh mempercepat pengindeksan tapak di Yandex? Ia perlu melakukan langkah-langkah berikut:

  • Pasang pelayar Yandex pada komputer anda dan bersiar-siar di laman web ini.
  • Sahkan hak untuk menguruskan sumber dalam Yandex.Vebmaster.
  • Di Twitter, siarkan pautan ke artikel itu. Adalah diketahui bahawa sejak tahun 2012 Yandex telah bekerjasama dengan syarikat ini.
  • Untuk tapak menambah carian dari Yandex. Dalam bahagian "Pengindeksan", anda boleh menentukan URL anda sendiri.
  • Masukkan kod "Yandex.Metrica", tanpa menandakan tanda "Menghantar halaman untuk pengindeksan dilarang."
  • Buat Peta Situs yang hanya wujud untuk robot dan tidak dapat dilihat oleh penonton. Pengesahan akan bermula dengannya. Alamat Peta tapak dimasukkan dalam robots.txt atau dalam bentuk yang sesuai dalam "Webmaster" - "Persediaan Pengindeksan" - "Peta Situs".

Tindakan pertengahan

Apa yang perlu saya lakukan sehingga laman web "Yandex" diindeks? Enjin carian domestik harus mempertimbangkan tapak utama sumber. Itulah sebabnya walaupun sebelum penerbitan artikel tersebut, perlu menambah kandungannya kepada "Teks Tertentu". Jika tidak, plagiaris menyalin rekod itu ke sumber mereka sendiri dan akan menjadi yang pertama dalam pangkalan data. Akibatnya, mereka akan diiktiraf sebagai penulis.

Pangkalan Data Google

Bagi Google, cadangan yang sama seperti yang diterangkan di atas akan dikenakan, hanya perkhidmatan yang berbeza:

  • Google+ (bukan Twitter);
  • Google Chrome
  • Peranti Google untuk pengaturcara - "Pengimbasan" - "Sama seperti Googlebot" - pilihan "Imbas" - pilihan "Tambah ke indeks";
  • Cari dalam sumber dari "Google";
  • Google Analytics (bukan "Yandex.Metrica).

Larangan

Apakah larangan mengindeks laman web ini? Anda boleh menyusunnya pada halaman keseluruhan, dan pada bahagian yang berasingan (pautan atau sekeping teks). Malah, terdapat larangan pengindeksan global, dan tempatan. Bagaimanakah ini sedar?

Pertimbangkan larangan menambah enjin carian ke laman web di Robots.txt. Menggunakan fail robots.txt, anda boleh mengecualikan pengindeksan satu halaman atau keseluruhan rubrik sumber seperti ini:

  1. Agen-pengguna: *
  2. Tidak membenarkan: /kolobok.html
  3. Tidak membenarkan: / foto /

Item pertama menunjukkan bahawa arahan ditakrifkan untuk semua MS, yang kedua menandakan larangan mengindeks kolobok.html file, dan yang ketiga tidak membenarkan menambahkan folder foto ke pangkalan data. Sekiranya anda ingin mengecualikan beberapa halaman atau folder, tentukan semuanya dalam "Robot".

Untuk mengelakkan pengindeksan helaian Internet yang berasingan, anda boleh menggunakan tag meta robots. Ia berbeza daripada robots.txt kerana ia memberi arahan kepada semua PC sekaligus. Tag meta ini mengikuti prinsip umum format html. Ia harus diletakkan di tajuk halaman antara tag . Masuk untuk larangan, contohnya, boleh ditulis seperti ini: .

Ajax

Dan bagaimanakah mengindeks laman web Ajax-Yandex? Hari ini, teknologi Ajax digunakan oleh banyak pemaju laman web. Sudah tentu, dia mempunyai peluang yang hebat. Dengan itu anda boleh membuat laman web interaktif yang berkelajuan tinggi dan produktif.

Walau bagaimanapun, halaman web robot enjin carian "melihat" tidak seperti pengguna dan penyemak imbas. Contohnya, seseorang melihat antara muka yang selesa dengan halaman Internet yang dimuatkan. Untuk crawler, kandungan laman yang sama boleh kosong atau diwakili sebagai kandungan HTML statik yang lain, untuk penjanaan skrip yang tidak masuk aksi.

Untuk membuat laman Ajax, anda boleh menggunakan URL dengan #, tetapi enjin pencarian robotnya tidak digunakan. Biasanya sebahagian daripada URL selepas # dipisahkan. Ini mesti diambil kira. Oleh itu, bukannya URL borang http://site.ru/#example, ia membuat aplikasi ke halaman utama sumber, yang terletak di http://site.ru. Ini bermakna bahawa kandungan senarai Internet tidak dapat masuk ke pangkalan data. Akibatnya, ia tidak akan muncul dalam hasil carian.

Untuk meningkatkan pengindeksan tapak Ajax, Yandex menyokong perubahan dalam robot carian dan peraturan untuk memproses URL laman web tersebut. Hari ini, webmaster dapat menunjukkan mesin carian "Yandex" untuk keperluan pengindeksan, mewujudkan skema yang sesuai dalam struktur sumber. Untuk ini anda perlukan:

  1. Gantikan dalam URL halaman simbol # pada #!. Sekarang robot akan memahami bahawa dia akan dapat memohon versi HTML mengisi helaian Internet ini.
  2. Versi HTML bagi kandungan halaman sedemikian harus diletakkan pada URL, di mana #! Digantikan oleh? _escaped_fragment_ =.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ms.birmiss.com. Theme powered by WordPress.