Tag
TurboQuant Google promette 6x meno VRAM per gli LLM, ma la compressione reale è 2,6x. I titoli memoria crollano, la community corre avanti.