BANDUNG, TEROPONGMEDIA.ID — Bank Nasional Indonesia (BNI) menerapkan web crawling secara proaktif terhadap website judi online yang menggunakan rekening BNI. Simak dalam artikel ini penjelasan mengenai web crawling seperti yang diterapkan BNI dalam pemberantasan judi online.
BNI telah memblokir 882 rekening yang digunakan untuk transaksi judi online sepanjang September 2023 hingga Juli 2024.
Seiring langkah pemerintah yang sedang gencar memberantas kejahatan judi online, BNI tak terima apabila rekeningnya digunakan nasabah untuk sarana transaksi judi online.
“BNI berkomitmen untuk memerangi perjudian daring,” tegas Direktur Human Capital and Compliance BNI, Mucharom, seperti dilansir Antara, Sabtu (27/7/2024).
Direktur Human Capital and Compliance BNI, Mucharom, seperti dilansir Antara, Sabtu (27/7/2024), menjelaskan bahwa pihaknya menerapkan enam strategi dalam pemberantasan judi online tersebut.
BACA JUGA: BNI Blokir 882 Rekening yang Digunakan untuk Transaksi Judi Online
Apa itu Web Crawling?
Mengutip laman Advance Innovations, web crawling adalah kegiatan mengindeks dan mengunduh data atau konten dari internet.
Selanjutnya data tersebut akan disimpan di database suatu mesin pencari atau search engine. Web crawling dijalankan oleh program atau sistem yang biasanya disebut web crawler, web spiders, spider bot, dan web bot.
Setiap search engine pasti memiliki satu web crawler yang bertugas mengumpulkan dan mengarsip atau mengindeks semua data informasi yang dicari oleh pengguna.
Kegiatan indexing data inilah yang akan membuat setiap pengguna mesin pencari bisa mendapatkan informasi yang mereka butuhkan.
Web Crawling merupakan proses membaca, mengumpulkan dan menyimpan seluruh informasi yang ada di sebuah website yang bekerja dengan sistem bot (web spider) untuk tujuan pengarsipan (indexing).
Tujuan dari web crawling adalah mencari atau menemukan URL atau link di internet, dengan fokus dan cakupan yang besar karena melingkupi seluruh halaman dan website yang ada di internet.
Output dari web crawling berfokus pada menghasilkan daftar URL yang telah di-crawling, dengan mekanisme kerja dari mesin pencari (search engine) akan melakukan crawling dari setiap kata kunci yang dicari.
Dari kata kunci inilah sistem akan langsung menelusuri seluruh internet dan database untuk menampilkan hasil pencarian website yang relevan dengan kata kunci tersebut.
Cara Kerja Web Crawler
1.Kata Kunci
Kata kunci dimasukkan ke dalam bar mesin pencari. Setelah di-enter, sistem bot akan langsung menelusuri (crawling) semua informasi yang ada di internet dan database.
Setiap website yang ditemukan dari hasil penelusuran akan diindeks. Sistem atau program akan melihat website mana saja yang paling relevan dengan kata kunci.
2. Contoh Web Crawler
Sebagian besar mesin pencari populer memiliki web spider sendiri yang mana menggunakan algoritma tertentu untuk mengumpulkan data tentang halaman web. Alat perayap web (web crawler) bisa berbasis desktop ataupun cloud.
Berikut beberapa contoh Web Crawler:
- Amazonbot: Web crawler dari web Amazon.
- Bingbot: Web crawler dari Microsoft untuk mesin pencari Bing.
- DuckDuckBot: Web crawler dari mesin pencari DuckDuckGo.
- Googlebot: Web crawler dari mesin pencari Google.
- Slurp bot: Web crawler dari mesin pencari Yahoo.
- Yandex Bot: Web crawler dari mesin pencari Yandex.
Standar Relevansi Website
1. Kunjungan Rutin
Setiap website yang telah terindeks oleh web crawling akan sering dikunjungi oleh sistem untuk melihat apakah ada konten terbaru dari setiap website.
Ini dilakukan agar sistem dapat memastikan hasil pencarian yang ditampilkan hanyalah halaman website yang terbaru dari suatu website.
Apabila ada website yang terdeteksi tidak aktif memperbarui halaman website mereka, kemungkinan besar website tersebut tidak akan ditampilkan.
2. Mematuhi Robots.txt
Robot.txt adalah sebuah file yang dimiliki oleh setiap website, di mana file tersebut berisi informasi mengenai halaman mana saja dari website tersebut yang boleh dan tidak boleh diindeks.
Web crawler akan melihat file ini untuk menentukan website tersebut akan ditampilkan atau tidak pada halaman hasil mesin pencari.
3. Pentingnya Suatu Website
Halaman website yang akan ditampilkan web crawler pada halaman hasil pencari (SERP) adalah halaman website yang memiliki banyak jumlah pengunjung atau memiliki traffic yang tinggi.
Banyaknya jumlah traffic menandakan bahwa halaman website tersebut berguna oleh pengguna.
Oleh karena itu setiap kali ada pengguna yang mencari kata kunci tersebut, web crawler akan menampilkan website yang jumlah traffic-nyapaling banyak.
Jumlah traffic memang penting, tetapi yang lebih penting adalah kata kunci yang terdapat di dalam halaman website tersebut. Apabila kata kunci yang dicari dengan yang ada di website relevan, maka website tersebut akan ditampilkan.
(Aak)