Selamat Malam sobat, untuk kali ini saya akan membagikan tutorial blog seperti biasanya. Sebelumnya sobat harus mengetahui apa itu Robot Web Crawler.Silakan simak penjelasan dibawah ini
Web crawler adalah suatu program atau script otomat yang relatif simple, yang dengan metode tertentu melakukan scan atau “crawl” ke semua halaman-halaman Internet untuk membuat index dari data yang dicarinya. Nama lain untuk web crawl adalah web spider, web robot, bot, crawl dan automatic indexer.
Web crawl dapat digunakan untuk beragam tujuan. Penggunaan yang paling umum adalah yang terkait dengan search engine. Search engine menggunakan web crawl untuk mengumpulkan informasi mengenai apa yang ada di halaman-halaman web publik. Tujuan utamanya adalah mengumpukan data sehingga ketika pengguna Internet mengetikkan kata pencarian di komputernya, search engine dapat dengan segera menampilkan web site yang relevan.
Gimana ? sudah mengerti bukan ? itu hanya sebagian penjelasan yang saya ambil dari blog milik orang lain. Untuk lebih jelasnya silakan sobat cari sendiri di google.com :D Nah, daripada bertele tele berikut saya sediakan list lengkap beserta tutorial pemasangannya
Tutorial Pemasangan
- Buka blog seperti biasa dan masuk ke template > edit html
- Coba cek template sobat apakah ada kode semacam ini ? "Follow, All" ?
Contoh kode:
<meta content='follow, all' name='googlebot'/>
<meta content='follow, all' name='Googlebot-Image'/>
<meta content='follow, all' name='msnbot'/>
<meta content='follow, all' name='robots'/>
- Jika ada maka lanjut ke nomor 4
- Lihat list dibawah ini misalnya "ABACHOBot"
Maka sobat harus merubahnya seperti ini
<meta content='follow, all' name='ABACHOBot'/>
Atau mungkin 008<meta content='follow, all' name='008'/>
Tinggal rubah sesuai namanya sob :D
- Gampang "Tinggal menambahkan" saja sob :D
List Crawler
LexxeBot
Linguee Bot
http://www.linguee.com/bot
LinkWalker
lmspider
lwp-trivial
mabontland
magpie-crawler
Mediapartners-Google
MJ12bot
Mnogosearch
mogimogi
MojeekBot
http://www.mojeek.com/bot.html
Moreoverbot
http://w.moreover.com
Morning Paper
msnbot
http://search.msn.com/msnbot.htm
MSRBot
http://research.microsoft.com/research/sv/msrbot
MVAClient
mxbot
http://www.chainn.com/mxbot.html
NetResearchServer
loopimprovements.com/robot.html
NetSeer Crawler
NewsGator
http://www.newsgator.com
NG-Search
http://www.ng-search.com)
nicebot
noxtrumbot
Nusearch Spider
www.nusearch.com
NutchCVS
http://www.nutch.org/docs/en/bot.html
Nymesis
http://nymesis.com
obot
oegp
omgilibot
http://www.omgili.com/Crawler.html
OmniExplorer_Bot
http://www.omni-explorer.com
OOZBOT
http://www.setooz.com/oozbot.html
Orbiter
http://www.dailyorbit.com/bot.htm
PageBitesHyperBot
http://www.pagebites.com
Peew
http://www.peew.de/crawler
polybot
http://cis.poly.edu/polybot
Pompos
http://pompos.iliad.fr
PostPost
http://postpo.st/crawlers
Psbot
http://www.picsearch.com/bot.html
PycURL
Qseero
Radian6
www.radian6.com/crawler
RAMPyBot
http://www.giveramp.com/bot.html
RufusBot
http://64.124.122.252/feedback.html
SandCrawler
SBIder
http://support.sitesell.com/contact-support.html
ScoutJet
http://www.scoutjet.com
Scrubby
http://www.scrubtheweb.com/abs/meta-check.html
SearchSight
http://SearchSight.com
Seekbot
http://www.seekbot.net/bot.html
semanticdiscovery
Sensis Web Crawler
SEOChat::Bot
SeznamBot
http://fulltext.sblog.cz/robot
ShopWiki
http://www.shopwiki.com/wiki/Help
Shoula robot
silk
http://www.slider.com/silk.htm
Sitebot
http://www.sitebot.org/robot
Snappy
http://www.urltrends.com
sogou spider
Sosospider
http://help.soso.com/webspider.htm
Speedy Spider
http://www.entireweb.com/about/search_tech/speedy_spider
suggybot
http://blog.suggy.com/was-ist-suggy/suggy-webcrawler
SynooBot
http://www.synoo.de/bot.html
Teoma
http://about.ask.com/en/docs/about/webmasters.shtml
TerrawizBot
http://www.terrawiz.com/bot.html
TheSuBot
www.thesubot.de
Thumbnail.CZ robot
http://thumbnail.cz/why-no-robots-txt.html
TinEye
http://tineye.com/crawler.html
truwoGPS
http://www.lan4lano.net/browser.html
TurnitinBot
http://www.turnitin.com/robot/crawlerinfo.html
TweetedTimes Bot
http://tweetedtimes.com
updated
http://www.updated.com
Urlfilebot
http://urlfile.com/bot.html
Vagabondo
http://webagent.wise-guys.nl
VoilaBot
http://www.voila.com
Vortex
http://marty.anstey.ca/robots/vortex
voyager
http://www.kosmix.com/crawler.html
webcollage
Websquash.com
wf84
http://www.almaden.ibm.com/cs/crawler
WoFindeIch Robot
http://www.search.wofindeich.com/robot.php
WomlpeFactory
http://www.Womple.com/bot.html
Xaldon_WebSpider
yacy
http://yacy.net/bot.html
Yahoo! Slurp
http://help.yahoo.com/help/us/ysearch/slurp
Yahoo! Slurp China
http://misc.yahoo.com.cn/help.html
YahooSeeker
help.yahoo.com/help/us/shop/merchant
YahooSeeker-Testing
http://search.yahoo.com
YandexBot
http://yandex.com/bots
YandexImages
http://yandex.com/bots
Yasaklibot
http://www.Yasakli.com/bot.php
Yeti
http://help.naver.com/robots
YodaoBot
http://www.yodao.com/help/webmaster/spider
yoogliFetchAgent
YoudaoBot
http://www.youdao.com/help/webmaster/spider
Zao
http://www.kototoi.org/zao
Zealbot
zspider
http://feedback.redkolibri.com
ZyBorg
http://www.WISEnutbot.com
INGAT Sob DITAMBAHKAN bukan dihapus atau diganti hehe :D