自宅のRTX3060で小さなLLMを自作してみた
Dataset({ features: ['text', 'footnote', 'meta'], num_rows: 10246 }) Filtered dataset size: 10,246 entries トークナイザー 青空文庫のデータのみで学習を行うということもあり既存のトークナイザーを使うより専用のものを使用した方が良いだろうと考え自作することにしました。 SentencePiece を直接呼び出し uni...
みんなの反応
はてなブックマークでの反応
※メールアドレスは公開されません。
