BLOOMChat: un nuevo chat multilingüe abierto LLM

El documento presenta BLOOMChat 176B, un LLM multilingüe basado en conversaciones. El modelo se desarrolló combinando datos de conversación sintéticos y ejemplos escritos por humanos de alta calidad, y después se entrenó con los conjuntos de datos generados por humanos Dolly 2.0 y OASST1. El modelo se evaluó mediante medidas cualitativas y cuantitativas de su capacidad para el chat multilingüe y las tareas multilingües. BLOOMChat obtuvo resultados prometedores en ambos experimentos, superando a otras variantes de BLOOM y a los modelos de chat de código abierto más avanzados en tareas de traducción. El modelo tiene limitaciones, como la alucinación y un rendimiento limitado a la hora de generar código preciso o resolver problemas matemáticos complejos. El documento también reconoce las contribuciones de varios investigadores y proyectos de código abierto al desarrollo de BLOOMChat. El documento proporciona enlaces a los conjuntos de datos utilizados en los experimentos e invita a la comunidad a debatir sobre BLOOMChat o a chatear con el equipo.

artículo completo

Deja una respuesta