Current Status
Not Enrolled
Price
Free
Get Started

Exploratory Data Analysis - EDA

Pendahuluan:

Exploratory Data Analysis (EDA) bagaikan jiwa bagi semua proses analisa data. Kemampuan untuk melakukan EDA dengan baik adalah syarat dasar utama bagi seluruh profesi yang terkait dengan pengolahan data, baik itu business intelligence, data analyst, data scientist, dan sebagainya. EDA juga menjadi tahapan awal dari kebanyakan proses analisa data dan menjadi suatu tahapan yang amat menentukan seberapa baik analisa data selanjutnya akan dihasilkan.

Komponen EDA meliputi preprocessing, perhitungan berbagai nilai statistics dasar (e.g. ukuran pusat dan penyebaran data), visualisasi, penyusunan hipotesis (dugaan awal), pemeriksaan asumsi, hingga story-telling dan reporting. Di dalamnya juga termasuk proses penanganan missing values, outlier, reduksi dimensi, pengelompokkan, transformasi dan distribusi data.

Tujuan:

Setelah mengikuti kuliah ini, tau-scientists (TS) diharapkan mampu untuk:

  1. Melakukan preprocessing yang tepat sesuai dengan permasalahan dan pemodelan yang akan dilakukan
  2. Menyusun berbagai pertanyaan yang tepat dari ringkasan data dan visualisasinya
  3. Melakukan proses EDA dengan efisien dan kreatif

Prasayarat:

Matematika Dasar, Statistika Dasar, pendahuluan pemrograman.

Silabus:

  1. Pendahuluan pemrograman (Python)
  2. Pendahuluan Exploratory Data Analysis
  3. Exploring Categorical Data
  4. Exploring Numerical Data
  5. Basic Statistics, distributions, and transformation
  6. Key Metrics, Indicators, and Decision Triggers
  7. Missing Value Analysis
  8. Outlier Analysis
  9. Interactive & Creative Visualization
  10. Exploring Visualization Tools
  11. Efficient Data Exploration
  12. Clustering, Dimensional Reduction techniques, and high-dimensional Visualization
  13. Dashboard, Story Telling, and EDA Reporting
  14. Capstone Project (Case Study)

Evaluasi:

Secara online pada setiap lesson akan memuat online quiz. Pengajar dari berbagai universitas dipersilahkan untuk menambahkan penilaian tambahan secara offline.

Software/Tools:

Python (Anaconda/WinPython/Google Colaboratory).

Modules: Numpy, Matplotlib, Seaborn, Pandas, Scikit-learn etc.

Diskusi/Pertanyaan:

https://tau-data.id/forums/forum/exploratory-data-analysis/

Referensi:

  1. Cox, V. (2017). Exploratory data analysis. In Translating Statistics to Make Decisions (pp. 47-74). Apress, Berkeley, CA.
  2. DuToit, S. H., Steyn, A. G. W., & Stumpf, R. H. (2012). Graphical exploratory data analysis. Springer Science & Business Media.
  3. Bock, H. H., & Diday, E. (Eds.). (2012). Analysis of symbolic data: exploratory methods for extracting statistical information from complex data. Springer Science & Business Media.
  4. Cleveland, W.S., 1993. Visualizing Data. Hobart Press.
  5. Cleveland, W.S., 1994. The elements of graphing data. Hobart Press.
  6. Few, S., 2009. Now you see it. Analytics Press.
  7. Harris, R.L., 1999. Information Graphics. Oxford University Press.
  8. Healy, K., 2018. Data Visualization: A Practical Introduction. Princeton University Press.
  9. Knaflic, C.N., 2015. Storytelling with Data. Wiley
  10. Robbins, N.B., 2005. Creating More Effective Graphs. Wiley.
  11. Tufte, E.R., 2001. The Visual Display of Quantitative Information, 2nd ed. Cheshire, CT: Graphics Press.
  12. Tufte, E.R., 1997. Visual Explanations. Cheshire, CT: Graphics Press.
  13. Tufte, E.R., 2006. Beautiful evidence. Cheshire, CT: Graphics Press.
  14. Wainer, H., 2009. Picturing the Uncertain World. Princeton University Press.
  15. Yau, N., 2013. Data Points – Visualization that means something. Wiley.
  16. Huff, D. (1993). How to lie with statistics. WW Norton & Company.
  17. Reinhart, A. (2015). Statistics done wrong: The woefully complete guide. No starch press.
Data Science, IoT, & Big Data

Taufik Sutanto has 35 posts and counting. See all posts by Taufik Sutanto