DeepSeek dan Tsinghua Mengembangkan Model AI yang Dapat Meningkatkan Diri Sendiri

Visualize a vibrant scene showcasing the partnership between an AI tech company and a university. There's a large screen displaying intricate algorithms, symbolic of the self-improving AI model under development. Nearby, a Hispanic woman and a Middle-Eastern man, both scientists, analyzing data on their high-tech tablets. Depict the backdrop as the bustling floor of a high-tech open-plan office. Despite the competitive atmosphere suggested by monitors displaying logos of competitor companies, the two primary characters exhibit collaboration and determination in their expressions and body language. The overall composition should convey a sense of technological advancement and innovation.

DeepSeek, bekerja sama dengan Universitas Tsinghua, mengembangkan model AI yang dapat memperbaiki diri sendiri yang dikenal sebagai DeepSeek-GRM, yang merupakan singkatan dari pemodelan hadiah generalis. Inisiatif ini bertujuan untuk meningkatkan efisiensi model AI sekaligus menyelaraskannya lebih dekat dengan preferensi manusia. Kemitraan ini telah menghasilkan metode pembelajaran penguatan baru yang mengurangi kebutuhan pelatihan untuk model AI, sehingga menurunkan biaya operasional. Pendekatan baru yang disebut self-principled critique tuning ini telah menunjukkan kinerja yang lebih baik dibandingkan dengan metode yang ada, dan dapat dicapai dengan sumber daya komputasi yang lebih sedikit.

Artikel lengkap

Tinggalkan Balasan