AGI
AGI 通用人工智能
书生·浦语 大语言模型确实很牛!
书生·浦语 目前开源的 20B模型性能超过了同参数规模竞争者。 更好的一点是,书生·浦语开源了训练和部署工具链 … 阅读更多
vLLM 加速LLM推理24倍
UC伯克利开源了 vLLM 这个大语言模型推理和服务引擎。 主要亮点包括: 主要技术亮点在于PagedAtte … 阅读更多
Ghost in the Minecraft:突破莫拉维克悖论,通用人工智能取得重要突破!
近期,来自商汤、清华大学、上海人工智能实验室等机构的研究人员提出了一种全新的框架——Ghost in the … 阅读更多
斯坦福最新Sophia优化器比Adam快2倍
斯坦福大学最近发布了一篇研究论文,提出了一种名为Sophia的新型优化器,用于提高大型语言模型(LLM)的预训 … 阅读更多
QLoRA: 高效Finetuning 量化 LLMs
Dettmers提出了一种高效的微调方法QLoRA,它能够在保持完整的16位微调任务性能的同时,将内存使用量降 … 阅读更多
VanillaNet: 极简主义的力量
最近,一篇名为《VanillaNet: the Power of Minimalism in Deep Lea … 阅读更多
知乎携手面壁智能推出全新开源大模型:CPM-Bee10b 登顶中文基座模型
2023年5月27日,知乎在2023中国国际大数据产业博览会上发布了最新的大语言模型成果。知乎合伙人、首席技术 … 阅读更多
ConvNeXt V2:使用遮罩自编码器共同设计和扩展ConvNets
由于改进的架构和更好的表示学习框架的推动,视觉识别领域在 2020 年代初期迅速现代化并提高了性能。例如,现代 … 阅读更多