大模型到底是怎么「理解」语言的?
很多人觉得大模型像魔法,但其实背后的原理并不神秘。从最基础的词向量讲起,一步步拆解 Transformer 架构的核心思想。
记录做产品、写代码、读书时的思考。更新不频繁,但每一篇都尽量写清楚、写克制。
很多人觉得大模型像魔法,但其实背后的原理并不神秘。从最基础的词向量讲起,一步步拆解 Transformer 架构的核心思想。
没有团队、没有融资,一个后端程序员如何从零开始做出一款 iOS App 并成功上架?记录那些只有自己做了才知道的事。
AI Agent 不只是概念炒作。我用它把每天重复的信息整理、内容生成、数据分析串联起来,实际效率提升了 3 倍。
一个现代 Python 项目管理工具,可以负责创建项目、安装依赖、管理虚拟环境和锁定依赖版本。
请求数据和接口定义的 Pydantic 模型不匹配。
使用 Python 读取时,通常会在代码中调用:
用于学习项目初始化、依赖安装和虚拟环境管理。 重点看 asyncio、typing、testing 相关专题。 重点看 models、field、validation。
本目录用于存放研发助手项目相关的架构图导出、录屏截图或示意图。
本文件用于帮助你完成月份 1 项目的最终验收与展示。
月份 1 不要求你做专业计费系统,但至少要能回答:
但前提是这些接口仍然调用同一套核心 service。
月份 1 用 CLI 可以快速验证核心服务是否合理。
本月只做以下 3 个核心功能中的 1-2 个即可:
本实验的目标不是证明 LangChain “一定更好”,而是训练你做客观比较:
LangChain 的 OutputParser 是把这类解析步骤抽象成单独组件。
它的作用是把原本手工拼接的 Prompt 变成模板。
如果此时直接跳进 LangGraph,很容易变成:
建议不要只在章节最后看一次,而是在做月份 1 第 3 周和第 4 周项目时反复对照:
因为月份 1 前面你已经学过模型流式输出,这一节要把它变成服务能力。
因为第 4 周的 CLI 入口会直接复用 ChatService 和 ToolService。如果你现在把逻辑写死在 FastAPI 路由里,后面一定要重构。
所以你的请求响应模型必须围绕这 3 个接口收束,不要过度设计。
因为 AI 应用最终很少只是脚本。你迟早会面对这些需求:
本文件用于汇总 Tool Calling 模块的实验要求和最终验收标准。
月份 1 的目标不是消灭所有失败,而是让失败清楚、可定位、可恢复。
否则以后 CLI、FastAPI、LangChain 都很难复用。
Tool Calling 的价值在于:让模型决定“该用哪个工具、传什么参数”,再由程序真正执行。
Prompt 学习不能停留在“记概念”。你必须像做实验一样记录:
不同 SDK 或兼容接口的流式细节会有差异,但课程中的抽象目标固定为:
自由文本适合阅读,但不适合程序继续处理。你后面会经常需要模型返回:
大多数聊天类 LLM API 都把输入组织为消息列表:
最核心的是 messages。它不是单纯的一句话,而是一组对话消息。
本模板用于统一月份 1 各练习项目的工程结构,避免你在每个项目里重新思考目录设计。
月份 1 中很多逻辑其实不依赖模型随机性,可以稳定测试:
Pydantic 是月份 1 的关键桥梁,因为它连接了:
在月份 1,你不需要复杂日志系统,但需要最小可读日志。
对初学者来说,这比混用 pip、venv、requirements.txt、poetry 更容易保持稳定。
本文件不是标准答案合集,而是练习记录模板。你应当在自己的学习过程中,把每一题的:
这些都属于 I/O 等待。异步能让程序在等待时更有效地安排执行。
如果你不会做异常处理,代码通常会在最脆弱的位置直接崩掉。
它们本质上都是“有结构的数据”。如果你不会用类或数据类,就很难把这些对象组织清楚。
初学时,把所有代码写进一个 main.py 很常见。但只要你开始做下面这些事,单文件就会失控:
如果你有 Java、Go、JavaScript、C# 等语言经验,可以这样理解 Python:
本目录用于存放月份 1 导航层相关的截图、流程图导出文件或补充图片。
如果你只会其他语言但不会 Python,这一节也必须从头做完。
你不需要严格按自然周推进,但必须按阶段完成验收。
本课程不是“资料链接集合”,而是一套可以逐步照做的训练手册。你需要边读边做,不能只阅读不操作。