Film Junky Union, sebuah komunitas baru bagi penggemar film klasik sedang mengembangkan sistem untuk memfilter dan mengategorikan ulasan film. Misi utamanya adalah melatih model agar bisa mendeteksi ulasan negatif secara otomatis. Kamu akan menggunakan dataset ulasan film IMBD dengan pelabelan polaritas untuk membuat sebuah model yang bisa mengklasifikasikan ulasan positif dan negatif. Model ini setidaknya harus memiliki skor F1 sebesar 0,85.
Data ini diperoleh dari Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, dan Christopher Potts. (2011). Learning Word Vectors for Sentiment Analysis. The 49th Annual Meeting of the Association for Computational Linguistics (ACL 2011).
Berikut adalah deskripsi untuk kolom yang dipilih:
- review: teks ulasan
- pos: target, '0' untuk negatif dan '1' untuk positif
- ds_part: 'train'/'test' untuk bagian train/test dari dataset
Sebenarnya, ada juga kolom-kolom lain di dataset. Kamu bisa menjelajahinya kalau tertarik.