Mari kita mulai segera dari kode skrip utama:
#! / usr / bin / perl
# Script-forum.pl.
# (C) 2010 Alexandr A AlexEev, http: // situs /
gunakan ketat;
# Berkomentar baris - untuk kekakuan
# Jika tugasnya adalah mengumpulkan statistik mesin, biarkan apa adanya
# Jika Anda membuat daftar forum - RASSATE
$ Data saya;
$ Data. \u003d $ _ Sementara (<>
)
;
# Periksa berapa didukung oleh phpBB tanpa referensi di ruang bawah tanah Ini dan skrip lain yang disebutkan dalam pos dapat ditemukan di arsip ini. Naskah yang-forum.pl. Meneliti kode halaman HTML untuk keberadaan tanda tangan mesin forum di dalamnya. Kami menggunakan penerimaan serupa ketika menentukan WordPress dan Joomla, tetapi ada beberapa perbedaan. Pertama, skrip itu sendiri tidak mengunggah kode halaman, dan membacakannya dari stdin atau file yang ditransmisikan sebagai argumen. Ini memungkinkan Anda untuk mengunggah halaman satu kali, misalnya, menggunakan wget, dan kemudian mengarahkannya melalui beberapa analis jika kita tidak sendirian. Kedua, dalam skrip ini, kehadiran tanda tangan adalah tanda 100% dari mesin. Terakhir kali kehadiran tanda tangan hanya memberi bobot ke mesin yang sesuai dan "memenangkan" mesin dengan berat terbesar. Saya memutuskan bahwa dalam hal ini pendekatan ini hanya akan menyulitkan kode. Untuk menguji karya skrip, saya menghabiskan sedikit studi. Saya daftar beberapa ribu forum dan mengendarai masing-masing melalui skrip saya, dengan demikian menentukan persentase pemicu program dan popularitas berbagai mesin. Untuk mendapatkan daftar forum, saya memanfaatkan Google Parser. Mesin pencari terkirim jenis jenis situs: Forum. *. Ru dll. Kode generator kode lengkap yang akan Anda temukan di file gen-forumsearch-urls.pl.. Selain zone.ru juga digunakan .su .ua .kz i.by. Terakhir kali, penelitian ini sulit, karena situs di WordPress dan Joomla tidak memiliki tanda tangan serupa dalam URL. Katalog seperti cmsmagazine.ru/catalog/ tidak menyediakan sampling yang cukup. Apa 600 situs di Drupal? Saya harus mengakui, hasil percobaan kesal saya. Dari 12590 situs yang dipelajari, hanya 7083 mesin yang bertekad, yaitu, hanya dalam 56% kasus. Mungkin saya tidak memperhitungkan mesin apa pun? Apakah ini benar-benar bitrix untuk melihat? Atau apakah saya berdiri lebih banyak waktu untuk membayar pencarian untuk tanda tangan? Secara umum, penelitian tambahan diperlukan di sini. Di antara 56% dari mesin yang berhasil diidentifikasi yang paling populer, seperti yang diharapkan, ternyata IPB (31%), PHPBB (26,6%) dan vBulletin (26,5%) Bagi mereka dengan lag besar di belakang SMF (5,8%) dan Dleforum (5,3%). Punbb favorit saya hanya ke-6 (1,64%). Saya tidak akan menyarankan untuk mempercayai angka-angka ini (kata mereka, setiap forum ketiga dalam runet bekerja pada IPB), tetapi kesimpulan tertentu melakukannya, tentu saja, Anda bisa. Misalnya, jika Anda bermaksud membuat situs web pada mesin forum dan berencana untuk memodifikasi forum, katakanlah, membayar pengguna $ 0,01 untuk setiap pesan dengan output otomatis dana seminggu sekali, maka Anda harus memilih salah satu dari tiga yang paling populer mesin. Semakin populer forum, semakin besar peluang menemukan seorang programmer yang dibongkar dengan baik di dalamnya. Jika perubahan signifikan pada mesin tidak diharapkan, mungkin masuk akal untuk memilih bukan mesin paling populer, misalnya SMF atau PunBB. Dengan ini, Anda akan mengurangi jumlah serangan hacker pada forum Anda dan jumlah spam secara otomatis mengirimnya. Skrip untuk pencarian / definisi forum juga dapat ditemukan tidak satu aplikasi praktis. Hal pertama yang muncul di kepala saya secara pribadi adalah mengurutkan forum yang diidentifikasi di Titz dan menempatkan posting dengan tautan ke salah satu situs mereka pada ratus pertama. Namun, ratusan tautan dofolllow forum tidak mempengaruhi TIC (2 pembaruan lulus), jadi lebih baik tidak menghabiskan waktu di sini, kecuali jika Anda tertarik pada transisi. Jelas bahwa nama skrip jauh dari satu-satunya. Saya pikir Anda akan dengan mudah menghasilkan bagaimana lagi Anda dapat menggunakannya. Diorganisir oleh Botmaster Labs, tidak merencanakan. Waktu tidak, video yang dibutuhkan untuk kompetisi, seperti tren baru-fashioned, meskipun lebih mudah untuk semua screenshot yang baik (saya IMHO) dapat dijelaskan (IMHO saya), dan tidak ada ingin Jatuh. Mereka yang sangat sedikit dari yang menguntungkan, spam bodoh sama sekali tidak memiliki pajak, di sini perlu untuk berpikir dan tema tidak akan jatuh, jika hanya mereka yang telah belajar untuk mencoba mendorong dalam wol yang indah dan berenang a sedikit. :) Tapi ini bukan tentang kami. Secara umum, ini 3 "tidak", saya pikir, sebagian besar menjadi hambatan untuk berpartisipasi dalam kompetisi untuk yang paling calon peserta. Di sini sebagai dengan perbaikan mobil tiga: murah, kualitas tinggi, cepat - hanya 2 kondisi dapat dilakukan secara bersamaan. Duduk dan pilih yang lebih dekat. :) Dengan kontes, hal yang sama adalah: ada waktu, aku tahu bagaimana untuk membuat video, tetapi tidak ada topik, atau saya tahu bagaimana membuat video, ada topik, tapi tidak ada waktu, atau Dan waktu bebas telah muncul dan ada yang kecil, tetapi ada waktu yang lebih kecil. Tapi ini bagus jika pada saat yang sama 2 kondisinya dilakukan. Ya, oh well, liriknya. Saya melanjutkan sendiri. Saya tidak merencanakan, itu berarti bahwa saya berpartisipasi dalam kompetisi, bahkan memilih artikel apa yang akan dipilih. Apa yang tidak dikatakan, dan dosis sangat tahu dan sangat masuk akal untuk menerapkannya. Tetapi hari ini saya mengetahui bahwa intrik muncul dalam kompetisi. Ternyata saya tidak dapat memilih, tetapi hanya dapat membuat pendatang baru yang telah mengakuisisi perangkat lunak pada tahun 2011 dan kompetisi dirancang untuk mereka. Sedikit terkejut, tetapi pemilik - Barin. Persaingan adalah perusahaan periklanan dan Alexander tahu bagaimana melakukannya. Secara umum, saya memutuskan kemudian untuk menjabarkan sebuah artikel, agak lebih mudah untuk ditulis, ketika jelas kepada siapa, untuk seluruh pertanian kolektif sebenarnya tidak mungkin untuk melakukannya. Didukung oleh php-fusion Di Khrumber versi 7.07, program ini dilatih di beberapa mesin baru: forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, dll. phpbb-fr.com, tema solaris phpbb Dan proses pembelajaran kontinu menjadi baru. "Didukung oleh SMF 1.1.2" "Didukung oleh SMF 1.1.3" "Didukung oleh SMF 1.1 RC2" "Didukung oleh SMF 1.1.4" "Didukung oleh SMF 1.1.8" "Didukung oleh SMF 1.1.7" "2006-2008, Simple Machines LLC" Dan itu tidak semua. Mengumpulkan versi mesin yang kami berada di beberapa forum CMF di footer kami menemukan "2001-2006, Lewis Media". Periksa permintaan ini, itu juga sepenuhnya memuaskan kami. Temukan permintaan serupa: "2001-2005, Media Lewis." Menjalankan footer di sebelah untuk menemukan kueri berikut: "Smfone Design by A.M.A, porting ke SMF 1.1". Periksa - sangat baik. Dll. Setengah jam kerja dan Anda memiliki basis data permintaan yang luar biasa pada mesin, dan untuk permintaan ini Google akan diblokir jauh lebih jarang daripada jika Anda menggunakan operator di dalamnya. Dan pada saat yang sama, pangkalan akan secara signifikan lebih bersih daripada jika Anda menggunakan permintaan, seperti "index.php? Topic \u003d", karena di sini Google akan memberikan tidak hanya forum yang kita butuhkan, tetapi juga banyak sumber daya kiri di mana dikelola Tinggalkan tautan ke topik toum. Anda bisa berdebat, kata mereka, apa yang salah dengan itu? Yang lain meninggalkan tautan, itu berarti kita bisa. Tapi! Tautan dapat meninggalkan tidak hanya manter, tetapi juga program lain. Selain itu, mereka dapat secara spesifik dipertajam untuk meninggalkan komentar dalam sumber daya tertentu, yang disebut perangkat lunak khusus sempit, ditambah tautan seperti itu dapat ditinggalkan. Sekali lagi saya ulangi, kami bukan kuantitas dumping, tetapi kualitasnya, permintaan yang benar akan kami kumpulkan. Ditambah metode ini juga dalam kenyataan bahwa Anda tidak perlu mengkonfigurasi di HRERER saringan -filter.
伟哥 - viagra. 吉他 - Gitar 其他 - hari libur 保险 公司 - Asuransi Masukkan file file di sini kode-kode ini menggantikannya: % E4% BC% 9F% E5% 93% A5 % E5% 90% 89% E4% BB% 96 % E5% 85% B6% E4% BB% 96 % E4% BF% 9D% E9% 99% A9% E5% 85% AC% E5% 8F% B8 Jika Anda mempromosikan situs untuk asuransi, maka letakkan tautan di profil pada tematik (!) Bahkan forum China ditemukan berdasarkan permintaan " forum SMF "保险 公司 Ini akan sangat bagus.
cetak "phpbb. \\ n "
jika ($ data \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? phpbb \\ .com \\ /? "[^\u003e] *\u003e phpbb / i Atau.
# $ Data \u003d ~ /viewForum\\.php \\? [^ "" ** f \u003d \\ d + / i atau
$ Data \u003d ~ / phpbb \\ -seo / i atau
$ Data \u003d ~ /)
;
cetak "ipb. \\ n "
jika ($ data \u003d ~ /] + href \u003d "[^"] * http: \\ / / / (?: www \\.)? Invision (?: Papan | daya) \\. com \\ /? [^ "] *" [^\u003e] * "[^\u003e] [^.<]*IP\.Board/i
Atau.
$ Data \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? InvisionBoard \\ .com \\ /? "[^\u003e] *\u003e Papan daya invisi / i Atau.
$ Data \u003d ~ /
$ Data \u003d ~ / Index /.php\\?[^""**showforum\u003d\\d+/i.)
;
cetak "vBulletin. \\ n "
jika ($ data \u003d ~ / Didukung oleh :? [^<]+vBulletin[^<]+(?:Version)?/i
Atau.
$ Data \u003d ~ /)
;
cetak "SMF. \\ n "
jika ($ data \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? SimpleMachines \\ .org \\ /? "[^\u003e] *\u003e Didukung oleh SMF / I Atau.
$ Data \u003d ~ /Index\\.php\\?[^"""#board\u003d\\d+\\.0/i.)
;
cetak "Punbb. \\ n "
jika ($ data \u003d ~ /] + Href \u003d "[^"] * http: \\ / / / (? :(?: Www \\.)? Punbb \\ .org | punbb \\ .informer \\ .com) \\ /? "[^\u003e] Punbb / I.); #Atau.
# $ Data \u003d ~ /vieweforum\\.php\\?[^"""*id\u003d\\d+/i);
cetak "fluksbb. \\ n "
# if ($ data \u003d ~ /viewtopic\\.php\\?id\u003d\\d+/i atau
jika ($ data \u003d ~ /] + href \u003d "http: \\ / / (?: www \\.) fluksbb \\ .org \\ /?" [^\u003e] *\u003e fluksbb / i)
;
cetak "EXBB. \\ n "
jika ($ data \u003d ~ /] + href \u003d "[^"] * http: \\ / / / (?: www \\.)? exbb \\ .org \\ /? "[^\u003e] *\u003e exbb / i); # ATAU
# $ Data \u003d ~ /forums\\.php\\?[^""**_forum\u003d\\d+/i);
cetak "YABB. \\ n "
jika ($ data \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? yabbforum \\ .com \\ /? "[^\u003e] *\u003e yabb / i Atau.
$ Data \u003d ~ /YABB\\.pl ~ /) "" * _ num \u003d \\ d + / i);
cetak "Dleforum. \\ n "
jika ($ data \u003d ~ / \\ (Didukung oleh DLE Forum \\)<\/title>/ Aku. Atau.
$ Data \u003d ~ /] + href \u003d "[^"] + (?: http: \\ / \\ / (?: www \\.)? dle \\. -files \\ .ru | Act \u003d Hak Cipta) [^ "] *"\u003e DLE FORUM<\/a>/ Aku.)
;
cetak "Ikonboard. \\ n "
jika ($ data \u003d ~ /] + href \u003d "[^"] * http: \\ / / / (?: www \\.)? Ikonboard \\ .com \\ /? [^ "] *" [^\u003e] *\u003e Ikonboard / i Atau.
$ Data \u003d ~ /\\ n "
jika ($ data \u003d ~ /\\ n "
# if ($ data \u003d ~ /forums\\.php\\?fid\u003d\\d+/i atau
# $ data \u003d ~ / topik \\ .php \\? fid \u003d \\ d + / i atau
jika ($ data \u003d ~ /] + href \u003d "http: \\ / / / (?: www \\.)? flashbb \\ .net \\ /?" [^\u003e] *\u003e flashbb / i)
;
cetak "Stokesit. \\ n "
# if ($ data \u003d ~ /forum\\.php\\?f\u003d\\d+/i atau
jika ($ data \u003d ~ /] + href \u003d "http: \\ / / / (?: www \\.)? stokesit \\ .com \\ .au \\ /?" [^\u003e] *\u003e [^ \\ /] * Stokes / i)
;
cetak "podium. \\ n "
# jika ($ data \u003d ~ / topik ~ fp \\? t \u003d \\ d + / i atau
jika ($ data \u003d ~ /] + href \u003d [""]? http: \\ / / / (?: www \\.)? sopebox \\ .com \\ /? [""]? [^\u003e] *\u003e podium / i)
;
cetak "usebb. \\ n "
# if ($ data \u003d ~ /forum\\.php\\?id\u003d\\d+/i atau
jika ($ data \u003d ~ /] + href \u003d "http: \\ / \\ / (?: www \\.)? usbb \\ .net \\ /?" [^\u003e] *\u003e usebb / i)
;
cetak "Wrforum. \\ n "
# jika ($ data \u003d ~ / index ~ fp \\? fid \u003d \\ d + / i atau
jika ($ data \u003d ~ /] + href \u003d "http: \\ / \\ / (?: www \\.)? wr \\ -script \\ .ru \\ /?" [^\u003e] *\u003e wr \\ -forum / i)
;
cetak "Yetanothorumnet. \\ n "
jika ($ data \u003d ~ / namun forum lain \\ .NET / I atau
$ Data \u003d ~ /Default\\.aspx\\?g\u003dposts&t\u003d\\D+/I.)
;
Situs: bicara. *. Ru
Situs: Papan. *. Ru
Situs: SMF. *. Ru
Situs: phpbb. *. Ru
....
Aksesasi panjang berakhir, sekarang to the point.
Apa yang dibutuhkan oleh seorang pemula ketika ia memperoleh kombinasi super seperti itu yang merupakan kompleks Xrumer + Hreefer? Benar, pelajari cara mengerjakannya dan buang ilusi itu, mulai spam lembaran, Anda dapat menghasilkan uang. Jika Anda berpikir begitu, lebih baik untuk segera mengorbankan uang Anda untuk amal. Anda perlu belajar menggunakan alat kompleks, lebih disukai mengurasnya di bawah Anda. Waktu "Ambil lebih banyak - lemparkan lebih lanjut" hilang. Jumlahnya lebih rendah dari kualitas. Jadi kami akan mengumpulkan database untuk diri sendiri, jangan belajar bagaimana melakukannya - tetap dari kereta. Ini akan membantu kita, secara alami, pertimbangkan. Jika Anda berencana untuk mempromosikan sumber daya Anda di Google, maka kita perlu mencari situs donor juga melalui Google. Saya pikir itu bisa dimengerti dan logis. Tetapi Google, seperti nyonya rumah Gunung Tembaga, tidak memberikan kekayaan kita kepada semua orang berturut-turut. Perlu untuk itu. Segera saya ingin mengatakan bahwa tidak berharap itu dengan alasan yang Anda temukan di publik, Anda dapat mengumpulkan sesuatu. Mereka karena mereka tersedia di publik bahwa Anda adalah anggota dari mereka. Saya tidak akan mengembangkan topik lebih lanjut. Lebih baik akan memberi tahu Anda cara mengumpulkannya dengan benar, sehingga Anda melihat hasilnya, sisa dari diri mereka sendiri meningkat, hal utama adalah memahami prinsipnya. Perlu untuk mengumpulkan sesuai dengan yang benar, pada tanda-tanda spesifik, mesin yang kita butuhkan, dan bukan tanda-tanda forum sama sekali. Ini adalah kesalahan utama pendatang baru - bukan untuk berkonsentrasi pada yang spesifik, dan mencoba menutupi semuanya sepenuhnya. Dan bahkan jika Anda ingin mendaftarkan database yang kurang lebih normal, menolak untuk menggunakan dalam permintaan operator. Tidak "inurl:", "situs:", "judul", dll. Google seperti yang Anda cari dilarang secara instan. Oleh karena itu, secara menyeluruh mempelajari mesin dengan ukuran saat ini bekerja:
Secara umum, kita perlu menyiapkan permintaan yang tepat untuk tarif Khrefer. Ambil misalnya forum ketiot Forum SMF.. Dan mari kita mulai membongkarnya pada suku cadang parsel. Dalam hal ini kami akan membantu Google favorit kami. Kami Masuk di Permintaan Google Forum SMF. - Banyak sampah dalam ekstradisi, bungkus pada halaman ke-13 dan pilih tautan apa pun. Saya menemukan ini: http://www.volcanohost.com/forum/index.php?topic\u003d11.0. Membuka dan mempelajarinya. Kita perlu menemukan karakteristik pada halaman yang dapat Anda terapkan pada pencarian halaman lain di mesin ini. Di footer perhatikan prasasti berikut Didukung oleh SMF 1.1.14, Saya membelanjakannya dan memperkenalkannya kepada Google, itu menunjukkan kepada kita bahwa pada permintaan ini dia tahu sekitar 59 juta pilihan. Saya secara singkat melihat tautan, tambahkan beberapa opsi lain ke kata kunci ini, misalnya, "Didukung oleh SMF 1.1.14" Poplar atau "Didukung oleh SMF 1.1.14" viagra. Kami yakin bahwa permintaan itu chic, di ekstradisi hanya forum dan hampir tidak ada sampah.
Bagi kami, apalagi, tidak ada jumlah yang menarik, tetapi kualitas seperti yang saya katakan di atas. Lanjutkan. Dari forum yang sama kami mengambil frasa lain dari footer: Juga, itu dikutip dan berkabut Google. Sebagai tanggapan, ia menunjukkan bahwa ia tahu lebih dari 13 juta hasil. Kami kembali secara singkat melihat penerbitan, tambahkan Dopcil dan periksa penerbitannya. Kami yakin bahwa permintaannya sangat baik dan juga hampir tidak ada sampah. Secara umum, sudah ada 2 kueri besi. Saya sarankan, forum pertama masih harus pergi sendiri dan terus mengumpulkan permintaan yang sudah ada di forum lain. Manfaat Google terbuka berdasarkan permintaan 2006-2008, Mesin Sederhana LLC. Kami ambil dari penerbitan, misalnya, forum ini: http://www.snowlinks.ru/forum/index.php?topic\u003d1062.0 dan http://litputnik.ru/forum/index.php?Action\u003dprintpage; topik \u003d 380.0 di pijakan, mereka mengambil permintaan berikut: "Didukung oleh SMF 1.1.7" dan "Didukung oleh SMF 1.1.10" (untuk mengarahkan pertanyaan untuk Garrity selalu menyarankan tempered, karena kita membutuhkan kualitas pertama). Saya pikir jelas apa yang kita lakukan, pada akhirnya kita akan memiliki basis data permintaan tertentu untuk mencari forum pada mesin SMF (dipilih misalnya, dengan mesin lain sama.
Ini akan terlihat seperti ini:
Saya berpikir bahwa untuk belajar pada tahap awal untuk secara kompeten menggunakan Khrefer sangat penting, karena Anda selalu dapat menemukan penggunaan krumer, tidak peduli bagaimana situasinya tidak berubah. Perlindungan rumit, dan jika pada beberapa jenis mesin memperkuat perlindungan dan tidak mengatasinya saat ini, di sini tidak masuk akal untuk menghabiskan sumber daya untuk mengumpulkan data tautan, dan kemudian mengerjakannya manter, itu Lebih baik memfokuskan kekuatan pada apa yang memberi hasilnya. Dan pada saat yang sama, jika tim Botmaster Labs mengajar seorang chrovovumer untuk sesuatu yang baru, Anda dapat dengan cepat membubarkan pasien baru dan menyiapkan basis Chrumera sampai pasien masih hangat. Waktu adalah uang, sumber daya mungkin tidak lagi relevan ketika Anda membeli database. dikumpulkan oleh seseorang. Selain itu, koleksi basis yang benar di bawah dirinya sendiri secara signifikan memperluas aplikasi "Putih" seorang chrimmer. Dan ini persis di mana semuanya bergerak, kita menginginkannya atau tidak, dan proses putih atau abu-abu akan datang. Lembar hitam untuk apa yang hanya bisa masuk ke masa lalu.
Semua yang lain, sudah saat-saat teknis bekerja dengan KhRefer dapat dilihat di Bantuan dan tidak masuk akal untuk berhenti pada mereka, semua tujuan-poin terkena cara yang berpengalaman untuk setiap mesin secara individual.
Sebagai bonus, taruh template untuk parsing mesin pencari Cina Baidu, hari lain saya ditanya tentang dia, saya lakukan antara bisnis, maaf untuk kata-kata itu. :)
Hostname \u003d http: //www.baidu.com
Kueri \u003d S? WD \u003d
Linkmask \u003d.
TotalPages \u003d 100.
NextPage \u003d.
Nextpage2 \u003d.
Captchaurl \u003d.
Captchaimage \u003d.
Captchafield \u003d.
Saya mencoba menuangkan tes kepada mereka, larangan itu tidak, sumber daya pembangkangan dikumpulkan dengan jelas, semua permintaan untuk parsing mirip dengan Googlovsky, tetapi sumber daya Cina - laut, dan dengan PR tinggi, dan selain itu, a banyak di mana tidak perlu untuk kaki Eropa. Memungut permintaan Cina yang lebih baik. Google-Translet akan membantu ini, Anda memutar daftar karakter kunci dalam bahasa Rusia dan menerjemahkannya ke dalam bahasa Cina. Benar dalam " kata-kata."Panduan kata tidak dapat dilipat pada bahasa Cina, Anda perlu dipasang kembali.
Alih-alih Cina:
Sebagai kesimpulan, saya ingin mengatakan bahwa saya tidak pernah mengerti orang-orang yang mengeluh bahwa Khrefer itu parah baik paisky, saya selalu ingin mengatakan, Anda hanya tidak tahu bagaimana memasaknya. Lebih baik Khrevel tidak ada parser dapat mengumpulkan penerbitan, hanya permintaan harus benar. HREWR - Mesin: Baik, berkualitas baik, dibuat dalam bahasa Jerman, tetapi mengelola pria-Nya dan semuanya tergantung pada seberapa sensitifnya dikelola, Anda tidak dapat pada saat yang sama membuat mobil dan kanan dan kiri.
Topik terpisah adalah membersihkan pangkalan, saya sekali 3 tahun yang lalu untuk kompetisi sebelumnya. Dengan yang lebih besar di sana, semuanya masih relevan, tetapi dari memeriksa 200 ok sekarang Anda dapat menolak, saya benar-benar tidak suka proses ini, kesalahan sangat besar, banyak penyaringan ekstra. Sekarang dapat dilakukan secara praktis pada mesin selama pekerjaan krumer, setidaknya proses ini bukan analog lengkap dari pemeriksaan pada "200 ok". Secara umum, untuk bisnis: Belum lama ini, peluang luar biasa telah muncul di Chrumera - untuk mengambil informasi dari sumber daya pada saat proyek berjalan. Sepertinya ini. Anda mengemudi di templat yang akan diproses selama pekerjaan, dan informasi yang dikumpulkan oleh templat akan dimasukkan ke dalam file xgrabbed.txt di folder log. Anda dapat menggunakan fungsi ini untuk apa pun, penerbangan fantasi sangat besar. Saya menggunakan fitur ini sekali seminggu untuk menghapus referensi dari basis yang berfungsi. Bukan rahasia lagi bahwa forum mati setiap hari untuk membersihkan pangkalan dari sumber daya seperti itu kepada kami dan akan membantu dalam hal ini alat autographebing.
Anda akan setuju, sering mendapatkan, misalnya, http://www.laptopace.com/index.php, kita melihat bahwa domain sudah, misalnya, goudyada berjalan, tetapi tidak ada forum di sana. Jadi untuk membuang terak ini dari pangkalan, kita akan ambil. :) Buka kode sumber halaman dan kami melihat entri ini di sana:
Sekarang semua "mati" dari goudaddy akan diketahui oleh kami secara berurutan.
Berikut ini adalah pilihan kecil untuk alat autograbbing, jika Anda ingin membersihkan database dari domain "eksposur" yang berbeda: