小不点搜索
登录
四块魔改2080ti显卡跑llama-3-70b-instruct-awq
收藏
举报
www.bilibili.com
6-16 13:22
[视频作者] 门的耳朵
[视频时长] 5:1
[视频类型] 数码
模型地址:https://hf-mirror.com/casperhansen/llama-3-70b-instruct-awq 对本地搭建有兴趣的可以参考:https://www.bilibili.com/read/readlist/rl823654 结论: 可以跑8k上下文, 速度20T/S, 16个并发请求后吞吐量是200T/S 。 有中文,可以用。 复杂指令遵循良好。
回复
编辑
⇧顶
⇩沉
影音视频访问链接
以下链接为影音视频“四块魔改2080ti显卡跑llama-3-70b-instruct-awq”在线访问地址,点击链接就可以访问查看啦
www.bilibili.com***366050
www.bilibili.com
说两句
X