Periksa kode machine learning saya secara menyeluruh untuk memastikan kepatuhan terhadap academic integrity dan best practices. Identifikasi setiap potensi masalah yang dapat mengkompromikan validitas hasil penelitian.
- Periksa apakah ada indikasi data fabrication atau manipulation
- Verifikasi bahwa semua data sources dijelaskan dengan jelas
- Pastikan tidak ada synthetic data yang tidak dideklarasikan
- Cek consistency dalam data preprocessing steps
- Identifikasi missing values handling yang tidak tepat
- Target Leakage: Pastikan tidak ada features yang mengandung informasi future/target
- Temporal Leakage: Verifikasi chronological order dalam time series data
- Training-Test Leakage: Cek bahwa preprocessing dilakukan setelah train-test split
- Cross-validation Leakage: Pastikan data preprocessing tidak dilakukan sebelum CV split
- Verifikasi bahwa CV strategy sesuai dengan nature data (time series, grouped data, etc.)
- Pastikan tidak ada data contamination antara folds
- Cek bahwa hyperparameter tuning menggunakan proper nested CV
- Identifikasi potential overfitting pada validation set
- Periksa apakah ada excessive hyperparameter tuning (p-hacking equivalent)
- Verifikasi bahwa model selection criteria ditetapkan sebelumnya
- Pastikan tidak ada cherry-picking results
- Cek transparency dalam feature engineering process
- Verifikasi bahwa metrics evaluation appropriate untuk problem type
- Pastikan statistical significance testing dilakukan dengan benar
- Cek sample size adequacy untuk conclusions yang dibuat
- Identifikasi potential bias dalam sampling atau evaluation
- Periksa random seed setting untuk reproducible results
- Verifikasi bahwa semua dependencies dan versions documented
- Pastikan kode dapat dijalankan ulang dengan hasil yang sama
- Cek completeness of documentation
- Identifikasi setiap step yang tidak dijelaskan dengan jelas
- Verifikasi bahwa limitations dan assumptions stated explicitly
- Pastikan negative results tidak disembunyikan
- Cek bahwa methodology choices justified properly
Berikan analisis dalam format berikut:
✅ COMPLIANT AREAS:
- List aspek yang sudah sesuai standar
- List masalah potensial dengan severity level (Low/Medium/High)
- Berikan explanation dan recommended fixes
❌ CRITICAL VIOLATIONS:
- List pelanggaran serius yang harus diperbaiki immediately
- Berikan specific guidance untuk perbaikan
📋 RECOMMENDATIONS:
- Saran untuk meningkatkan academic rigor
- Best practices yang belum diimplementasikan
Saya adalah [mahasiswa/peneliti] yang sedang mengerjakan [jenis penelitian/tugas]. Hasil ini akan [dipublikasikan/dipresentasikan/disubmit] untuk [tujuan akademik]. Prioritaskan integritas akademik di atas optimasi performa model.
Catatan: Jika ada bagian kode yang tidak dapat diakses atau unclear, minta clarification sebelum memberikan final assessment.