Lematisasi dan Stemming

Viewing 2 reply threads
  • Author
    Posts
    • #6537
      Priska Maya PutriPriska Maya Putri
      Participant

      Izin bertanya, bagaimana jika kita ingin melakukan lematisasi dari suatu data yang bahasa nya bercampur, Misalkan indo inggris indo inggris. apakah di general jadi satu bahasa dulu apa gimana ya?
      Mungkin teman teman bisa membantu

      #Priska Maya

    • #6541
      Taufik SutantoTaufik Sutanto
      Keymaster
      • Sebenarnya bergantung Text Mining apa yang ingin dilakukan.
      • Cara paling dasar sebenarnya lakukan Language detection, baru kemudian lakukan Lemma. Namun cara ini computational Cost dan kompleksitas model cukup tinggi.
      • Cara lain terjemahkan ke satu bahasa lalu lakukan lemma (seperti yang ditulis di pertanyaan).

      Bagaimana caranya silahkan lihat di https://tau-data.id/nlptm-01/ dan https://tau-data.id/nlptm-02/

    • #6546
      Gery Ferdian AlyGery Ferdian Aly
      Participant

      Iya kalau menurut saya tergantung tujuan text miningnya itu, apa mau ke dalam bahasa Indonesia atau bahasa Inggris. Mungkin dapat menggunakan slangword replace. Misal kalau tujuan akhirnya ke B.Indonesia bisa ditulis di slangword misal “working=bekerja”, “you=kamu” ,dst. Otomatis nanti datanya akan diubah pada tahap slangword replace menjadi seperti yang didefinisikan di data slangword yang kita buat. Setelah itu bisa melakukan tahap lematisasi dengan 1 bahasa.

      Mungkin kalau ada yg keliru, bisa dikoreksi dari teman-teman

Viewing 2 reply threads
  • You must be logged in to reply to this topic.