RISC-V 跑大模型（二）：LLaMA零基础移植教程 - 与非网

导航目录

电路设计

企业专区

应用/图谱

与非原创

资讯

视频

活动

简介
推荐器件
相关资讯
相关推荐

这是RISC-V跑大模型系列的第二篇文章，主要教大家如何将LLaMA移植到RISC-V环境里。

1. 环境准备

1）最新版Python

2）确保机器有足够的内存加载完整模型（7B模型需要13~15G）

3）下载原版LLaMA模型和扩展了的中文模型

LLaMA原版模型：

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

2. 模型下载

从LLaMA原版模型地址上下载下述文件（我们使用的是7B）：

最后文件下载完成后的结果如下：

3. 加载并启动

1）这一步需要下载llama.cpp，请输入以下命令进行下载和编译：

git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && make

2）将第二步下载的文件移到llama.cpp/models/下，使用命令：

python3 convert-pth-to-ggml.py models/7B/ 0

3）将.pth模型权重转换为ggml的FP32格式，生成文件路径为models/7B/ggml-model-f32.bin。

4）运行./main二进制文件，-m命令指定Q4量化模型（也可加载ggml-FP16的模型）。以下是解码参数及示例：

./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3

参数解释：

4.结束

本篇教程到这里就结束了。是不是觉得LLaMA的速度比较慢而且不支持中文，没关系，在下一期中，我们会为LLaMA扩充中文，并优化加速LLaMA，记得继续关注我们哦。

另外，RISC -V跑大模型系列文章计划分为四期：

1. RISC -V跑大模型（一）

2. RISC-V 跑大模型（二）：LLaMA零基础移植教程（本篇）

3. LLaMA扩充中文+优化加速（计划）

4. 更多性能优化策略。（计划）

如果有朋友在移植过程中遇到了问题，欢迎加群一起交流，一起搞大模型。

想尝试自己移植又没有RISC-V平台的小伙伴可以看看最近澎峰科技推出的“0元GO”活动，可以免费试用RISC-V，详情可以在下面的文章链接里了解。

版权声明：与非网经原作者授权转载，版权属于原作者。文章观点仅代表作者本人，不代表与非网立场。文章及其配图仅供工程师学习之用，如有侵权或者其他问题，请联系本站作侵删。侵权投诉

推荐器件

下载所有器件模型

器件型号：ATXMEGA128A3U-MH
- 数量 1
- 建议厂商 Atmel Corporation
- 器件描述 RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, MLF-64
- 参考价格 $6.98
- 风险等级中
- ECAD模型
- 数据手册
- 查看更多信息
器件型号：PIC32MX795F512L-80I/PF
- 数量 1
- 建议厂商 Microchip Technology Inc
- 器件描述 32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 14 X 14 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100
- 参考价格 $10.4
- 风险等级低
- ECAD模型
  
  ECAD模型
  
  下载ECAD模型
- 数据手册
- 查看更多信息
器件型号：ATXMEGA256D3-AU
- 数量 1
- 建议厂商 Atmel Corporation
- 器件描述 RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM HEIGHT, 0.80 MM HEIGHT, GREEN, PLASTIC, MS-026AEB, TQFP-64
- 参考价格 $7.78
- 风险等级中
- ECAD模型
- 数据手册
- 查看更多信息

相关资讯

1.

融合的系统，融合的计算
18小时前
2.

德晟智能开拓海外市场，聚焦德国汉诺威工业展
18小时前
3.

三星成立HBM3E特别工作组，抢500亿大单
23小时前
4.

多元化、高辨识显示丨基于G32A1445的汽车尾灯解决方案
23小时前
5.

半导体龙头齐聚SEMiBAY/湾芯展，展示中国半导体全产业链生态盛况
05/13 07:30
6.

到底什么是弱上下拉和强上下拉？
05/12 16:28
7.

电容经常过流会有什么后果
05/11 16:14
8.

无功补偿电容器随器补偿是什么意思
05/11 16:14
9.

分析丨AI服务器芯片的市场蛋糕越来越诱人了？
05/11 11:53
10.

DEKRA德凯苏州400KW逆变器实验室正式落成
05/11 11:09
11.

与AI共舞，RISC-V芯片加速落地生根
05/11 09:22
12.

不安装补偿柜对电网的影响
05/11 09:09
13.

电容器合闸涌流抑制设备有哪些
05/11 09:02
14.

并联电容器放电是断开电源吗
05/11 08:58
15.

轧钢机加热炉是直流电吗
05/11 08:58
16.

重大进展，NXP推出全球首款5纳米汽车MCU
05/10 14:58
17.

大联大品佳集团推出基于Infineon产品的汽车热管理方案
05/09 15:08
18.

「超星未来」完成数亿元Pre-B轮融资，加码边缘侧大模型推理芯片
05/09 13:52
19.

苹果M4芯片问世，直接让iPad Pro秒杀了所有AI PC！
05/09 10:10
20.

联发科携生态伙伴发布《生成式AI手机产业白皮书》，引领手机生成式AI风潮
05/09 09:55

查看全部20条内容

相关推荐

带 RISC-V ASSP 的语音控制人机界面
瑞萨电子 2023/05/08
第三届滴水湖中国RISC-V产业论坛
与非网 2023/08/25
配备 RISC-V 内核 ASSP 的三相电机控制
瑞萨电子 2022/11/17
2022 RISC-V CON 引领RISC-V运算大时代驾驭未来多元芯应用
Moore8摩尔吧 2022/08/11
RISC-V 2021中国峰会系列活动-RVBoards分享会
Moore8摩尔吧 2021/06/17