技术精选集

收录优质技术文章,点击卡片直接跳转原文

微信公众号 ·

教你从零“手搓”一个大模型,别再只会调用API了

作者:yongzheng, patrickguo 在大模型满天飞的今天,我们是甘心做一个只会调用 OpenAI.chat.completions 的 API 搬运工,还是想真正弄懂那个黑盒子里到底发生了什么?本文将用最朴素的代码,完整的实现一个小型LLM。当你亲手写出 Attention 层的矩阵乘法,亲眼看到模型从输出乱码到学会说话,你会发现:大模型,其实也没那么可怕。 RoadMap 1. 引言 1.1 背景 在部门浓厚的AI技术探索氛围驱动下,为了将晦涩的理论转化为直观的工程触感,我们开展一次略带“整活”性质的实践。

阅读原文