tau-Scientist, Keep your balance point !!!

Hi TS… we’re back!!! Seperti janji kami sebelumnya sistem perpointan di web tau-data ini akan terus di update… step by […]

tau-scientist (TS) Points and Achievements

Hallo TS sekalian !!! tau-data Indonesia kali ini akan memperkenalkan sistem baru dalam penggunaan website ini, sebentar lagi kami akan […]

SNTIKI 2019

Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2019

Industri 4.0 belum setengah jalan, tapi Akademisi harus berada jauh di depan. Tujuannya agar investasi yang dilakukan saat ini kelak berbuah pada saat yang tepat dimana industri dan masyarakat membutuhkannya. Atau bahkan perguruan tinggi menjadi driving force arah pengembangan teknologi yang akan menentukan/membentuk masa depan. Kira-kira seperti apa ya detail lebih lanjut diskusi persiapan Industri 5.0 ini? ... Gabung yuk, info lebih lanjut disini: http://sntiki.uin-suska.ac.id/

Simulation

Aproksimasi Monte Carlo

Apakah metode Monte Carlo itu? Bagaimana cara kerjanya? Pada situasi seperti apa saya memerlukan metode Monte Carlo? Untuk menjawab pertanyaan - pertanyaan tersebut, mari simak tulisan berikut.

Introduction to Data Science Workshop

Fakultas Sains dan Teknologi Universitas Islam Negeri Sunan Gunung Djati Bandung bekerjasama dengan tau-data Indonesia dalam kegiatan : "PENGEMBANGAN KOMPETENSI DOSEN DAN TENAGA KEPENDIDIKAN"

kalbis institute featuring tau-data Indonesia

Knowledge Sharing : “Peluang &Tantangan Data Science (Big Data) dalam Dunia Pendidikan & Industri”

Knowledge Sharing Peningkatan Keilmuan Lintas Bidang dalam Meningkatkan Kinerja Dosen Hari/Tanggal : Jum’at/05 Juli 2019 Tempat : Kalbis Institute, Ruang AR305 Lantai 3 Knowledge Sharing yang diadakan oleh Fakultas Bisnis Kalbis Institute meliputi Prodi Matematika, Akuntansi, Management dan Magister Management.

Asumsi Statistik: Antara Benci & Butuh (Studi Kasus Regresi)

Ketika kita membaca teorema Pytagoras: "Jika diberikan segitiga siku-siku maka kuadrat panjang sisi miringnya adalah penjumlahan kuadrat dua sisi lainnya" maka kita akan mudah memahami bahwa akibat (syarat perlu/necessary condition) hanya bisa dipastikan kebenarannya jika asumsi (syarat cukup/sufficient condition) terpenuhi. Artinya kalau diberikan segitiga yang bukan siku-siku, maka tidak ada jaminan (yang diberikan oleh teorema Pytagoras) bahwa panjang kuadrat suatu sisinya merupakan penjumlahan dari kuadrat sisi lainnya (Gambar 1).

Fast Cosine Dissimilarity for Sparse (CSR) Vectors in High-Dimensional Data

Big-Data Scientist bukanlah seorang programmer, ia mungkin tidak memiliki kemampuan untuk membuat software sehandal para programer sejati. Namun tuntutan profesi menuntut mereka untuk mampu membuat High Performance Codes/program. Data scientist (DS) adalah ‘speed freak‘, yang ndak pernah puas kalau tidak bisa mengaplikasikan model statistika/matematika dengan performa yang optimal sesuai dengan teori.

SMA on Instagram: Image Hashing – Mendeteksi Gambar Serupa

Social Media Analytics tidak selalu terkait data dalam bentuk teks. Idealnya teks dan gambar (bahkan video) secara simultan/bersamaan di olah untuk mendapatkan hasil analisa yang lebih baik. Ketika mengolah data dari media sosial Instagram, pengolahan data images semakin diperlukan, ketimbang (a more) text-based media sosial seperti twitter.

Loci VS Centroid/Hubs: Pendekatan Baru dalam Menganalisa Data yang Besar (Big Data)

Artikel ini adalah pembahasan non-teknis dan penjelasan lebih lanjut dari artikel saya di Springer Lecture Notes in Computer Science Series tentang Clusters’ Loci dan mengapa ia adalah salah satu perkembangan penting menarik dalam dunia Big Data (Mining).  Accepted version dari papernya dapat diunduh di link green open access QUT ePrint berikut (Link).

Evaluasi Eksternal Clustering “Pairwise” F-ß-Score & NMI: Teori & Aplikasi

Tidak seperti model klasifikasi (supervised learning), evaluasi pada model clustering (unsupervised learning) jauh lebih menantang. Mengapa? Hal ini berawal dari definisi awal permasalahan pengelompokan (clustering) yang sebenarnya tidak well-definedditambah dengan tidak adanya nilai pembanding yang jelas seperti klasifikasi.

Teori Graph di Python lewat NetworkX: Studi Kasus Greedy Algorithm

Di post sebelumnya kita sudah mengaplikasikan Teori Graph di data media sosial. Post ini justru mundur ke belakang dan fokus ke memperkenalkan NetworkX untuk aplikasi terkait Teori Graph secara umum. Graph banyak digunakan untuk memodelkan berbagai permasalahan di dunia nyata, mulai dari media sosial, transportasi, Data Science, sampai penyelesaian permainan Sudoku.

NLP - Text Mining

Text PreProcessing & Terms Distribution

Artikel ini merupakan lanjutan dari artikel sebelumnya tentang Crawling Data Twitter dengan Python. Akan tetapi apa yang dijelaskan di artikel ini dapat diterapkan di sembarang data text/dokumen, tidak harus data sosial media. Preprocessing text seperti stopword filtering & stemming, serta menghitung term distribution (frekuensi kata) dibahas menggunakan Python. Di tulisan selanjutnya kita akan coba melakukan analisa lanjut seperti clustering, centrality, community detection, visualisasi, dsb.

Pereda Sakit Kepala: Urgensi Memahami String (di Python)

Tipe variabel string gampang² susah untuk dipahami, sebenarnya tidak hanya di Python, tapi juga di hampir semua bahasa pemrograman. Kadang ia baik, kadang pemarah ... eh salah ... maksudnya selain mempengaruhi akurasi model data science/machine learning, program yang berjalan dengan baik bisa tiba² crash karena penanganan string yang tidak tepat. Di level produksi minimal ini adalah disaster level Dragon (OPM-😁).

PDS1

Cython: semudah Python & secepat Java, bahkan lebih

Beberapa waktu yang lalu saya menulis sebuah artikel yang membandingkan performa 7 bahasa pemrograman ketika memproses 3 operasi dasar: “if”,”for”, & “while”.  Beberapa bahasa pemrograman seperti Matlab, PHP, R, & Python memiliki keleluasaan antara sebuah interpreter dan compiler, bahkan diantara keduanya (JIT). Artikel kali ini akan memperkenalkan Cython (compiled Python) dan melihat peningkatan performanya dibandingkan versi murni Python, JIT, dan Java.

Menyiapkan Modul Python untuk Suatu Pelatihan?

Semenjak Data Science (DS) & Big Data (BD) ngetrend di dunia akademis & jagad digital (kalau disebut "dunia Maya" takutnya ada yang keselek 😄), berbagai pelatihan atau workshop menjamur di berbagai tempat. (Don't get me wrong, it's a good thing. Educating people is always a good thing). Biasanya pelatihan terkait DS/BD ini akan menggunakan bahasa pemrograman Python, R, atau Java.