fineweb-edu-100b-shuffle:HuggingFace上的karpathy/fineweb-edu-100b-shuffle是开源教育数据集,含1000亿 tokens优质学术内容,经精心筛选与打乱处理,适合训练大语言模型。遵循ODC-BY协议,助力开发者打造更智能的AI应用。【此简介由AI生成】 - AtomGit AI社区