「最大3倍速」と「2.24倍速」、2つのLLM高速化技術は8GBのMacBook Neoに通じるか、128GB M4 Maxでも試して得た結論(CloseBox) | テクノエッジ TechnoEdge
ローカルLLMの世界では、毎週のように「最大◯倍速」という見出しが流れてきます。今週飛び込んできたのは二本立てでした。 一つはGoogle純正、Gemma 4ファミリー向けの「Multi-Token Prediction(MTP)ドラフター」。もう一つはApple Silicon専用の「MTPLX」というMLXフォーク。前者は最大3倍、後者は2.24倍。数字だけ見...
みんなの反応
はてなブックマークでの反応
