SinarHarapan.id-Dikutip dari laman resmi BRIN pada Jumat (22/3/2024), Peneliti Ahli Madya Pusat Riset Sains Data dan Informasi BRIN, Slamet Riyanto, menjelaskan bahwa riset model NER dengan pendekatan multi source dilatarbelakangi dari adanya studi literatur yang telah dilakukan melalui dokumen ilmiah tidak terstruktur seperti artikel jurnal, laporan, abstrak maupun riview.

“Untuk itu perlu adanya metode otomatis dan komputasi yang diperlukan untuk mengekstrak informasi berharga dari data tidak terstruktur,” ujar Slamet saat Webinar Edisi Ke-dua Pusat Riset Sains Data dan Informasi bertajuk “Peran Sains Data dalam Optimisasi Aktivitas Pertanian”.

Ia menyampaikan bahwa informasi yang didapatkan dari berbagai data tidak terstruktur tersebut telah diekstraksi dengan bantuan Information Extraction (IE), sehingga NER merupakan subtugas IE dengan melibatkan pengenalan entitas tertentu yang ada dalam teks.

“NER dalam biomedis bertujuan untuk mengenali dan mengkarakterisasi entitas khusus, seperti chemical, drug, disease, protein, DNA, RNA, dan gen,” ujarnya.

Slamet mengatakan bahwa NER memiliki kemampuan untuk memperoleh wawasan berharga dari teks domain khusus, sehingga memungkinkan berbagai aplikasi seperti menganalisis relevansi statistik entitas tertentu seperti disease, namun, belum ada model yang mampu secara akurat mendeteksi entitas plant dan disease dalam sebuah dokumen.

“Pengenalan entitas tanaman dan penyakit bermanfaat sebagai sarana studi literatur untuk mengungkap manfaat dan dampak buruk tanaman terhadap kesehatan manusia,” kata Slamet.

Riset tersebut melakukan sebuah pengembangan model NER menggunakan pendekatan multi-source transfer learning.

“Model yang dihasilkan adalah Plant-Disease Named Entity Recognition (PDNER) yang dilatih menggunakan multisumber dalam domain biomedis dan botani. Diharapkan model PDNER mampu mengenali entitas tanaman dan penyakit dalam dokumen secara akurat,” ujarnya.

Slamet juga menyampaikan, pengembangan NER telah menghasilkan metode otomatis dan komputasi, sehingga dapat membantu pendekatan studi literatur dalam mendeteksi entitas tumbuhan dan penyakit.

Preprocessing yang telah dilakukan dan tepat, dapat meningkatkan kinerja model. Sehingga model yang dikembangkan mampu memprediksi entitas pada domain biomedis dan botani secara akurat. Pendekatan multi source transfer learning, dapat membantu mengatasi keterbatasan data berlabel pada target domain,” terang Slamet..

Guru Besar Divisi Teknik Sistem dan Industri, Departemen Teknik Industri Pertanian IPB, Taufiq Djatna, turut menjadi narasumber dalam Webinar Edisi Ke-dua Pusat Riset Sains Data dan Informasi dengan topik “Peran Sains Data dalam Optimisasi Aktivitas Pertanian” dengan penyampaian materinya mengenai The Future of Blockchain in Agriculture.(isn/info publik)