Belajar ChatGPT dengan Cara Unik: Analogi Sejarah Islam dari Kenabian hingga Kekhalifahan

Senin, 18 Agustus 2025 - 11:14 WIB

URL berhasil dicopy

Membaca Sejarah ChatGPT: Perkembangan Model AI dari GPT-1 hingga GPT-4.(Foto: ilustrasi AI/solihin-utehso)

Pre-training: Model dilatih pada data teks besar (misalnya Wikipedia, buku, artikel).

Tugas utamanya adalah language modeling (memprediksi kata berikutnya).

Fine-tuning: Model kemudian disesuaikan dengan data khusus, misalnya untuk percakapan.

SCROLL TO RESUME CONTENT

2.3 RLHF (Reinforcement Learning from Human Feedback)

ChatGPT menggunakan RLHF:

1. Model menghasilkan beberapa jawaban.

2. Annotator manusia memberi penilaian.

3. Model reward dilatih dari preferensi tersebut.

4. GPT disesuaikan menggunakan reinforcement learning agar lebih sesuai dengan keinginan manusia.

5 1 vote

Article Rating

0 Comments

Newest

Oldest Most Voted

Inline Feedbacks

View all comments

Berita Terbaru

POLRI

Kapolres Melawi Minta Personel Hindari Judi Online, Narkoba, dan Pelanggaran

POLRI

Tim Propam Polda Kalbar Gelar Gaktibplin, Periksa Kendaraan dan Atribut Anggota

POLRI

Tim Propam Polda Kalbar Pastikan Personel Polres Melawi Bebas Judi Online

POLRI

Tim Propam Polda Kalbar Periksa Sikap Tampang hingga Kelengkapan Personel

POLRI

Kalbar Perkuat Penanganan Anak Tidak Sekolah Lewat Komitmen Lintas Sektor

POLRI

Polsek Muara Pawan Sambangi Warga Desa Sukamaju, Dengarkan Keluhan dan Aspirasi