Chainbase开源首个加密领域大模型Theia-Llama-3.1-8B,性能超越主流模型

2024-10-11 15:26:20律动BlockBeats分享至:

BlockBeats 消息,10 月 11 日,近日全链数据网络 Chainbase 宣布在 HuggingFace 开源其专为加密领域打造的大语言模型 Theia-Llama-3.1-8B。该模型在困惑度(Perplexity)和 BERT 评分上均超越了市场主流模型,对 crypto 世界的理解能力超过大多主流开源大模型。
Chainbase 团队独创性地构建了首个专业
Web3 数据集,收录了 CoinMarketCap 前 2000 项目的各类资料。数据集经过手动和算法过滤,确保训练数据的准确性、多样性和专业性。基于此数据集,团队采用 LoRA 技术高效微调模型,并利用 DeepSpeed 等工具加速训练过程。此外,模型量化为 Q8 GGUF 格式,大幅降低了内存占用,提升了推理速度。
据悉,Theia-Llama-3.1-8B 是 Chainbase 在加密领域大模型的初步尝试且该模型已成功应用于 Chainbase DEMO 交互应用 TheiaChat,目前日活用户超过 30 万。

虚拟币简介

可在虚拟空间购买商品和服务的非真实货币。全部

虚拟币行情

 今日价格24小时涨跌幅24小时成交额总市值

免责声明:作为区块链信息平台,本站所发布文章仅代表作者个人观点,与Bi123立场无关。文章内的信息、意见等均仅供参考,并非作为或视为实际投资建议。

最有价值的区块链信息和数据平台




扫码下载APP添加官方微信
行情机会交流