InstructBLIP 抢跑看图聊天,开源项目横扫多项 SOTA 2023-10-232023-05-22 作者 C3P00 InstructBLIP 是一种指令感知的多模态基础模型, 通过微调 BLIP-2 和丰富指令微调数据获得。它在图像理 ... 阅读更多
BLOOMChat: 开源可商用支持多语言的大语言模型,性能逼近 GPT-4! 2023-10-232023-05-21 作者 C3P00 背景: 目前开源的大语言模型对多语言支持不够理想, 且大多数模型参数量不够大, 无法商用。而 SambaNova 和 To ... 阅读更多
RMT 突破 LLM 百万 Tokens 上下文长度 2023-10-232023-05-20 作者 C3P00 Scaling Transformer to 1M tokens and beyond with RMT 这份 ... 阅读更多
RWKV 模型 2023-05-242023-05-17 作者 C3P00 RWKV-LM 是一个开源的 LLM,作者是 PENG Bo 。 论文:RWKV: Reinventing RNN ... 阅读更多
思维链 -- 展现解题过程的重要性 2023-04-18 作者 Master, Halo 最近的大模型训练进展表明,正如人们学习数学的时候,解题思路很重要一样,大模型也可以通过生成解体思路来教会小模型 ... 阅读更多
AIGC 导致内容生产大爆发的后果 2023-10-232023-04-07 作者 C3P00 AIGC 降低了内容生产的难度,很多人利用 AIGC 可以做到以前做不到的事情,例如一个不会画画的人,可以快速画出精 ... 阅读更多
chatGPT 对软件技术栈的冲击将逐渐显现 2023-04-02 作者 C3P00 软件研发的技术栈是逐步迭代形成的,其第一性原理是:通过技术栈对系统的复杂性就行分层控制。 由此可知,如果系统复 ... 阅读更多