Kuis per 5 - Data Mining - Rigger Damaiarta Tejayanda - 21416255201093 - IF21 A

KUIS PERTEMUAN 5 DATA MINING


A.) Artikel Website PDF

link download pdf

click aku

B.) Video Pembahasan / Presentasi


C.) Artikel Website

Artikel Website didalam blogspot

Soal !

Selesaikan secara mandiri
Anda diberikan data transkrip nilai dan data lulusan dari universitas melalui API. Data transkrip nilai mencakup detail nilai yang diperoleh mahasiswa untuk mata kuliah yang diambil. Data lulusan memberikan informasi demografis dan akademik mahasiswa, termasuk tanggal masuk dan lulus, serta predikat kelulusan. (API Dokumentasi : https://documenter.getpostman.com/view/6355959/2sA35HY1XM atau dapat di lihat pada bagian FInal Project Information ).
1. Integrasi dan Pembersihan Data.

  • Cari IPS setiap semester permahasiswa. ini bisa memudahkan untuk normalisasi data
  • Gabungkan IPS permahasiswa dengan dataset yang lainya ("ms_lulusan") berdasarkan NIM.
  • Tambahkan hasil dari durasi studi masing-masing mahasiswa
  • Lakukan pembersihan data, termasuk mengidentifikasi dan mengatasi nilai yang hilang atau tidak konsisten dalam data. Hilangkan mahasiswa pindahan.
  • Standardisasi format tanggal dan jenis kelamin untuk analisis lebih lanjut.

2. Analisis

  • Cari pola atau tren yang paling mempengaruhi dengan lulusan tepat waktu atau lama masa studi, misal :
  1. Analisis apakah ada hubungan antara nilai rata-rata mata kuliah atau IPS dengan lulusan tepat waktu. 
  2. Analisis apakah ada korelasi positif antara predikat kelulusan 'Pujian' dengan lulusan tepat waktu
  3. Analisis untuk melihat apakah durasi studi lebih pendek berkorelasi dengan predikat kelulusan yang lebih baik
  4. Hitung rata-rata nilai total untuk masing-masing jenis kelamin dan bandingkan untuk melihat apakah ada perbedaan signifikan dalam prestasi akademik berdasarkan jenis kelamin
  5. atau gabungan dari beberapa variabel yang mempengaruhi lulusatepat waktu

3. Laporan dan Presentasi

  • Sajikan hasil analisis dalam bentuk laporan tertulis yang lengkap dengan grafik atau tabel yang mendukung hasil analisis.

Kriteria Penilaian

  • Kemampuan untuk melakukan integrasi dan pembersihan data
  • Keefektifan dalam menerapkan teknik analisis statistik 
  • Kemampuan analisis untuk menemukan pola dan tren yang signifikan.
  • Kedalaman analisis dan kreativitas dalam mengeksplorasi data
  • Kelengkapan dan kejelasan laporan akhir, termasuk penggunaan visualisasi data

Di buat dalam bentuk artikel website & tersedia format PDF untuk di dowload. yang dikumpulkan adalah LINK ARTIKEL DI WEBSITE.


JAWABAN !

Pendahuluan

Dalam upaya untuk meningkatkan tingkat kelulusan tepat waktu di Universitas Buana Perjuangan Karawang, Penulis melakukan analisis data terperinci untuk memahami faktor-faktor yang mempengaruhi kelulusan mahasiswa. Dengan memanfaatkan data transkrip nilai dan data lulusan melalui API universitas, Penulis menerapkan integrasi, pembersihan data, dan analisis statistik untuk mengeksplorasi pola dan tren yang signifikan.

Data diambil menggunakan API, Saya melakukan convert ke file csv supaya memudahkan running code, karena efiesiensi yang tinggi dan tidak memerlukan get data melalui API. Berikut gambar atau dokumentasi code untuk get data transkrip nilai dan ms lulusan.

Gambar 1 Get Data API dan Convert API to CSV Transkrip Nilai

Gambar 2 Get Data API dan Convert API to CSV Ms Lulusan

Berdasarkan Gambar 1 dan Gambar 2, didapat hasil bahwa data transkrip nilai berisi 256299 data, sementara ms lulusan berisi 4542 data. Data tersebut kemudian akan digunakan dalam mengisi Kuis Dibawah ini.

Pembahasan

1.   Integrasi dan Pembersihan Data.

a.   Cari IPS setiap semester permahasiswa. ini bisa memudahkan untuk normalisasi data

Gambar 3 EDA DataFrame Transkrip Nilai

Exploratory Data Analysis atau EDA yang berada di Gambar 3 menunjukan beberapa kolom. Berdasarkan soal a, kita memerlukan pemahaman terhadap DataFrame. Setelah menganalisis, Didapat hasil pada Gambar 4.

Gambar 4 Mencari IPS setiap semester permahasiswa

Gambar 4 menunjukan pengelompokkan data transkrip berdasarkan Nomor Induk Mahasiswa (NIM) dan semester. Pada code tersebut menjelaskan perhitungan rata-rata Indeks Prestasi Semester (IPS) untuk setiap mahasiswa pada setiap semester. Perhitungan dilakukan dengan mengalikan nilai grade dengan jumlah SKS untuk setiap mata kuliah, menjumlahkannya, dan kemudian membagi hasilnya dengan total SKS untuk semester tersebut, lalu  nilai IPS dibulatkan menjadi desimal.

b.  Gabungkan IPS permahasiswa dengan dataset yang lainya ("ms_lulusan") berdasarkan NIM

Gambar 5 Menggabungkan IPS permahasiswa dengan dataset ms lulusan

Gambar 5 menunjukan penggabungan IPS per mahasiswa dengan dataset ms lulusan. Penggabungan ini berdasarkan Nomor Induk Mahasiswa atau NIM. Setelah Penggabungan ini data diperoleh 36228 data yang terlihat pada Gambar 6.

Gambar 6 Total Data setelah digabungkan

c.   Tambahkan hasil dari durasi studi masing-masing mahasiswa

Gambar 7 Hasil Durasi Studi masing-masing Mahasiswa

Gambar 7 menunjukan durasi studi per mahasiswa. Dengan mengonversi tanggal masuk dan tanggal lulus menjadi tipe data date time. Lalu Ini menghitung durasi studi setiap mahasiswa dengan mengurangi tanggal masuk dari tanggal lulus, kemudian hasilnya dibagi dengan 365 untuk mengonversi hari ke tahun, dan hasilnya dibulatkan menjadi satu desimal. Jika durasi studi lebih dari 4 tahun maka kolom lulus_tepat_waktu berisi ‘tidak tepat waktu’, jika kurang maka hasilnya ‘tepat waktu’.

d.  Lakukan pembersihan data, termasuk mengidentifikasi dan mengatasi nilai yang hilang atau tidak konsisten dalam data. Hilangkan mahasiswa pindahan.

Pada soal d, terdapat 3 tahapan dalam pembersihan data. Yaitu cek missing value, data duplikat, serta menghilangkan mahasiswa pindahan. Cek missing value terdapat pada Gambar 8.

Gambar 8 Cek data Missing Value

Gambar 8 menunjukan pada setiap kolom tidak terdapat data missing value. Setelah dilakukan pengecekan data missing yang ada pada Gambar 8. Tahap selanjutnya dilakukan cek data duplikat yang terlihat pada Gambar 9

Gambar 9 Cek data Duplikat

Gambar 9 menunjukan tidak terdapat baris yang duplikat. Kemudian tahap selanjutnya adalah menghilangkan mahasiswa pindahan, dengan cara menghapus nilai status masuk yang sama dengan 1. Menghilangkan mahasiswa pindahan dapat dilihat pada Gambar 10.

Gambar 10 Menghilangkan Mahasiswa Pindahan

Pada Gambar 10 menunjukan data mahasiswa pindahan dihilangkan pada dataframe. Hasil dari menghilangkan data mahasiswa pindahan menunjukan dataframe yang sekarang berjumlah 36168 data yang terlihat pada Gambar 11.

Gambar 11 Jumlah data setelah hilangkan mhs pindahan

e.   Standardisasi format tanggal dan jenis kelamin untuk analisis lebih lanjut.

Gambar 12 Standardisasi format tanggal dan jenis kelamin

Gambar 12 menunjukan format tahun bulan tanggal serta penyesuaian jenis kelamin. Dengan mengganti kolom jenis kelamin yang memiliki value 0 menjadi perempuan dan value 1 menjadi laki-laki.

2.   Analisis

Cari pola atau tren yang paling mempengaruhi dengan lulusan tepat waktu atau lama masa studi, misal :

a.   Analisis apakah ada hubungan antara nilai rata-rata mata kuliah atau IPS dengan lulusan tepat waktu.

Gambar 13 Analisis rata-rata nilai IPS dan lulus tepat waktu

Gambar 13 menunjukan apakah ada hubungan antara nilai rata-rata mata kuliah atau IPS dengan lulus tepat waktu. Nilai IPS dihitung secara rata-rata untuk setiap kategori lulusan tepat waktu dan tidak tepat waktu. Dilakukan uji statistik untuk membandingkan rata-rata IPS antara mahasiswa menggunakan uji t(t-test) antara dua kelompok data, yaitu IPS mahasiswa yang lulus tepat waktu dan IPS mahasiswa yang lulus tidak tepat waktu. Nilai p-value dari uji berfungsi untuk melihat perbedaan rata-rata IPS antara kedua kelompok tersebut signifikan secara statistik atau tidak. Hasil ditunjukan untuk mahasiswa yang lulus tepat waktu, rata-rata IPS-nya adalah 3.585509, sementara untuk mahasiswa yang tidak lulus tepat waktu, rata-rata IPS-nya adalah 3.515049, artinya ata-rata IPS mahasiswa yang lulus tepat waktu sedikit lebih tinggi dibandingkan dengan mereka yang tidak lulus tepat waktu. Hasil p-value dari uji t menunjukan hasil 7.738838606796278e-93, berarti rata-rata IPS antara kedua kelompok tidak atau kurang mempengaruhi secara signifikan dalam lulus tepat waktu. Untuk lebih jelasnya dapat dilihat pada visualisasi yang ada pada Gambar 14 yang menggunakan box-plot yang memberikan gambaran bahwa nilai IPS tidak terlalu mempengaruhi lulus tepat waktu.

Gambar 14 Box plot Distribusi Hubungan antara IPS dan lulus tepat waktu

b.  Analisis apakah ada korelasi positif antara predikat kelulusan 'Pujian' dengan lulusan tepat waktu

Gambar 15 Analisis apakah predikat pujian berkaitan dengan lulus tepat waktu

Gambar 15 menunjukan input dan output hasil analisis perhitungan apakah ada korelasi antara predikat pujian dengan lulus tepat waktu. Melalui librarypd.crosstab()’ yang memiliki fungsi untuk membuat tabel silang antara kolom 'predikat' dan 'lulus_tepat_waktu'. Kemudian dengan menggunakan uji chi-square melalui fungsi ‘stats.chi2_contingency()’ untuk menentukan apakah ada korelasi antara predikat kelulusan dan status lulusan tepat waktu. Nilai p-value dari uji chi-square memberikan informasi tentang signifikansi statistik dari hubungan antara dua variabel tersebut. Hasil dari analisa ini didapat 8 mahasiswa yang mempunyai predikat ‘-‘ lulus tepat waktu, lalu 32 mahasiswa yang memiliki predikat ‘-‘ tidak tepat waktu lulusnya, kemudian terdapat 161 mahasiswa yang memiliki predikat ‘memuaskan’ yang lulus tepat waktu dan 473 mahasiswa yang memiliki predikat tidak tepat waktu, dan seterusnya. Dari Nilai p-value dari uji chi-square adalah 0.0, yang menunjukkan bahwa terdapat korelasi yang signifikan antara predikat kelulusan dan lulusan tepat waktu. Untuk lebih detail bisa dilihat pada Gambar 16 yang menunjukan bahwa predikat kelulusan mempengaruhi lulus tepat waktu.

Gambar 16 Visualisasi analisa predikat kelulusan terhadap lulus tepat waktu

c.   Analisis untuk melihat apakah durasi studi lebih pendek berkorelasi dengan predikat kelulusan yang lebih baik

Gambar 17 Analisa apakah durasi studi lebih pendek berkorelasi dengan predikat kelulusan

Pada Gambar 17 menunjukan hasil analisa dari apakah durasi studi berkorelasi dengan predikat kelulusan. Dengan penghitungan rata-rata durasi studi untuk setiap kategori predikat kelulusan. Data dikelompokkan berdasarkan predikat kelulusan menggunakan metode ‘groupby’, dan kemudian dihitung rata-rata durasi studi untuk setiap kelompok predikat. Hasilnya disimpan dalam variabel durasi_predikat_mean. Hasil ditunjukan pada Gambar 18 menggunakan Boxplot.

Gambar 18 Visualisasi durasi studi mempengaruhi predikat kelulusan

Pada Gambar 18 didapatkan hasil bahwa durasi studi mempengaruhi predikat kelulusan. Predikat ‘pujian’ yang memiliki rata-rata studi sekitar 4.06 tahun. Kemudian predikat 'Sangat Memuaskan', rata-rata durasi studinya adalah sekitar 4.67 tahun. Sementara predikat 'Memuaskan', rata-rata durasi studinya adalah sekitar 5.31 tahun. Yang artinya mahasiswa yang mendapatkan predikat 'Pujian' cenderung memiliki rata-rata durasi studi yang lebih pendek dibandingkan dengan mahasiswa yang mendapatkan predikat 'Memuaskan' atau 'Sangat Memuaskan'.

d.  Hitung rata-rata nilai total untuk masing-masing jenis kelamin dan bandingkan untuk melihat apakah ada perbedaan signifikan dalam prestasi akademik berdasarkan jenis kelamin

e.   atau gabungan dari beberapa variabel yang mempengaruhi lulus tepat waktu

Gambar 19 menggabungkan nilai IPS dengan nilai total semester

Nomor d dan nomor e digabung karena saling berkaitan. Pada Gambar 19 menunjukan perhitungan nilai rata-rata setiap mahasiswa. Serta penggabungan nilai IPS dengan nilai total per semester pada setiap mahasiswa ke dalam DataFrame yang sudah ada sebelumnya didalam variabel ‘merged_df’. dengan cara melakukan merge berdasarkan kolom NIM dan semester. Tujuannya untuk mendapatkan rata-rata total nilai dalam prestasi akademik setiap mahasiswa. Kemudian akan dikelompokan total nilai berdasarkan jenis kelamin yang dapat dilihat pada Gambar 20.

Gambar 20 Menghitung rata rata nilai total berdasarkan jenis kelamin

Gambar 20 menujukan rata-rata nilai total untuk berdasarkan jenis kelamin. Hasil dari Gambar 19 digunakan dalam tahap ini, yang dimana mengambil nilai dari kolom 'nilai_total' untuk setiap kelompok jenis kelamin tersebut, lalu menghitung rata-ratanya. Pada jenis kelamin laki-laki didapatkan hasil rata-rata nilai totalnya sekitar 82.27, sementara mahasiswa jenis kelamin perempuan, rata-rata nilai totalnya adalah sekitar 80.82. Jadi hasil pada Gambar 20 merupakan nilai rata-rata dari semua nilai total yang ada dalam dataset, yang telah dikelompokkan berdasarkan jenis kelamin. Untuk lebih jelasnya dapat dilihat pada visualisasi diagram batang pada Gambar 21 yang dimana didapat hasil bahwa jenis kelamin laki-laki memiliki rata-rata nilai total yang lebih besar dibandingkan dengan jenis kelamin perempuan.

Gambar 21 Visualisasi rata rata nilai berdasarkan jenis kelamin yang sudah disatukan dengan nilai total

3.   Laporan dan Presentasi

Sajikan hasil analisis dalam bentuk laporan tertulis yang lengkap dengan grafik atau tabel yang mendukung hasil analisis.


Link yt : https://youtu.be/9j9kBcuxPss

Link blog : https://ubpkarawang21-093riggerdt.blogspot.com/2024/04/kuis-5-data-mining-rigger-damaiarta.html



Kesimpulan

Melalui analisis data yang mendalam, kami dapat menyimpulkan bahwa faktor-faktor seperti predikat kelulusan, durasi studi, dan jenis kelamin memiliki pengaruh signifikan terhadap tingkat kelulusan tepat waktu di Universitas Buana Perjuangan Karawang. Dengan pemahaman yang lebih baik tentang faktor-faktor tersebut, universitas dapat mengambil langkah-langkah strategis untuk meningkatkan tingkat kelulusan tepat waktu mahasiswanya.


Kriteria Penilaian

Kemampuan untuk melakukan integrasi dan pembersihan data

Keefektifan dalam menerapkan teknik analisis statistik

Kemampuan analisis untuk menemukan pola dan tren yang signifikan.

Kedalaman analisis dan kreativitas dalam mengeksplorasi data

Kelengkapan dan kejelasan laporan akhir, termasuk penggunaan visualisasi data

 

Di buat dalam bentuk artikel website & tersedia format PDF untuk di dowload. yang dikumpulkan adalah LINK ARTIKEL DI WEBSITE.

0 comments:

Posting Komentar