小不点搜索 登录

四块魔改2080ti显卡跑llama-3-70b-instruct-awq

[图]
6-16 13:22
[视频作者] 门的耳朵
[视频时长] 5:1
[视频类型] 数码
模型地址:https://hf-mirror.com/casperhansen/llama-3-70b-instruct-awq 对本地搭建有兴趣的可以参考:https://www.bilibili.com/read/readlist/rl823654 结论: 可以跑8k上下文, 速度20T/S, 16个并发请求后吞吐量是200T/S 。 有中文,可以用。 复杂指令遵循良好。
[图]四块魔改2080ti显卡跑llama-3-70b-instruct-awq
回复   编辑   ⇧顶   ⇩沉
影音视频访问链接
以下链接为影音视频“四块魔改2080ti显卡跑llama-3-70b-instruct-awq”在线访问地址,点击链接就可以访问查看啦
[图]
说两句