Bu belge, çıkarım adımı başına bir n-token dizisini verimli bir şekilde çözebilen ve gecikmeyi azaltan yeni bir paralel kod çözücü ailesi olan Tutarlılık Büyük Dil Modellerini (CLLM’ler) tanıtmaktadır. CLLM’lerin, rastgele başlatılan herhangi bir n-token dizisini mümkün olduğunca az adımda otoregresif (AR) kod çözme ile elde edilen aynı sonuca eşleyerek paralel kod çözme gerçekleştirmek üzere eğitildiği açıklanmaktadır. Önerilen yöntem, ek bellek maliyeti gerektirmeden Medusa2 ve Eagle gibi diğer hızlı çıkarım teknikleriyle karşılaştırılabilir şekilde üretim hızında önemli gelişmeler göstermektedir. Sıralı üretim sürecini paralel olarak çözülebilen n doğrusal olmayan denklem sistemine dönüştüren Jacobi kod çözme yöntemi tartışılmaktadır. Belgede ayrıca küresel tutarlılık (GC) kaybı, yerel tutarlılık (LC) kaybı ve geleneksel AR kaybı dahil olmak üzere CLLM’ler için eğitim süreci detaylandırılmaktadır. CLLM’lerin, orta düzeyde ince ayar maliyetleri ile özel alanlarda ve açık alan konuşma zorluklarında önemli hızlanma sağladığını vurgulamaktadır. Ek olarak, CLLM’ler doğru belirteçleri önceden tahmin etme yeteneğini sergiler ve tutarlılık oluşturma hedefi aracılığıyla çok sayıda eşdizimde yeterlilik kazanır.
