「最大3倍速」と「2.24倍速」、2つのLLM高速化技術は8GBのMacBook Neoに通じるか、128GB M4 Maxでも試して得た結論（CloseBox） | テクノエッジ TechnoEdge

ローカルLLMの世界では、毎週のように「最大◯倍速」という見出しが流れてきます。今週飛び込んできたのは二本立てでした。一つはGoogle純正、Gemma 4ファミリー向けの「Multi-Token Prediction（MTP）ドラフター」。もう一つはApple Silicon専用の「MTPLX」というMLXフォーク。前者は最大3倍、後者は2.24倍。数字だけ見...