Ajax Zhan's Blog
Welcome!This is Ajaxzhan.
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。
为应对论文评审、开源贡献等场景需在同一机器配置两个Git身份:实名与匿名。本文推荐“全局实名+局部匿名”策略,即通过`git config --global`设置默认身份,再在特定仓库内用`git config`局部覆盖。同时,为匿名身份生成独立SSH密钥,并配置`~/.ssh/config`文件创建专属Host别名(如`github-anon`),最后在匿名项目中使用该别名设置远程地址,即可实现身份隔离与安全管理。该方法利用Git配置层级和SSH别名,清晰、安全地解决了多身份切换需求。
本文介绍了“Vibe Coding”这一以AI为核心编码主力、人类聚焦于需求定义、项目管理等高价值环节的协同工作模式。文章分享了其最佳实践:强调编码前先规划并沉淀文档以建立AI的长期记忆;主张用脚本和配置固化确定性流程,提升系统可靠性;倡导小步迭代以便评审与学习;并分享了手动管理AI上下文的技巧。作者最后指出,AI时代的工程师需掌握结构化表达、系统思维等元技能,其角色正从“写代码”转向“设计系统、拆解任务、验收成果”。
本文聚焦大模型底层显存占用与推理优化,核心涵盖训练与推理两阶段分析。训练时显存主要由模型参数、优化器、激活值、梯度值构成,其中优化器(如AdamW的梯度指数平滑值、梯度平方指数平滑值、参数值)占用最大,混合精度下llama13b训练显存可达222.5GB,LoRA通过冻结主体参数、仅优化低秩矩阵显著节约显存。推理阶段引入KV Cache缓存历史token的k、v向量,避免重复计算,使flops基本恒定;显存开销源于模型参数与KV Cache,时间分预填充(TTFT)与解码(TPOT)阶段,受GPU算力与HBM速率影响,如llama-7B解码阶段TPOT约9.3ms。
本文介绍了MySQL数据库定时备份的三种方法:Linux/Unix系统可通过`mysqldump`命令编写备份脚本,结合cron定时任务实现;Windows系统可使用任务计划程序执行批处理脚本;Spring Boot项目则可通过`@Scheduled`注解实现定时备份。关键注意事项包括:确保备份脚本权限安全,定期验证备份完整性,将备份文件存储到远程位置避免单点故障。建议在低峰期执行备份以减少性能影响,或专门开一个服务负责备份任务,保障数据安全。
本文围绕香农熵、交叉熵与KL散度的关联展开,旨在帮助理解KL散度这一大模型强化学习中的核心概念。信息量用-log表示,小概率事件信息量更大;香农熵是概率分布的平均信息量,描述不确定性,均匀分布熵大、聚拢分布熵小。交叉熵为估计分布q对真实分布p的平均信息量估计,通常大于等于香农熵,分布越接近越趋近。KL散度量化两分布差异,定义为交叉熵减香农熵,具有非负(仅相等时为0)、不对称(非距离)性质,最小化KL散度等价于最小化交叉熵,故交叉熵可用于损失函数。另一理解角度:基于P采样,比较两分布下概率相近程度可判断分布相似度。
本文分享了《金刚经》中的“六度”修行法门,将其视为一种引导人从烦恼此岸到达智慧彼岸的生活方法论。六度包括:布施,即从“要”到“给”的心态转变;持戒,即有所不为,规范自身;忍辱,即面对逆境的智慧与勇气;精进,即纯粹不懈的努力;禅定,即专注调心以求澄澈;般若,即看透事物本质的根本智慧。作者强调,这并非抽象教义,而是实在的生活态度,旨在通过自我雕琢,关注内心成长,从而实现内心的平静。
本文聚焦代码相关基准数据集构建,香港科技大学Jialun CAO博士通过分析10年内274个基准,发现普遍存在样本重复、错误参考代码、未处理敏感信息等问题。为此提出55条标准清单,并系统阐述基准开发的五阶段生命周期:设计阶段需明确动机、范围与能力;构建阶段需规范数据收集、预处理与验证;验证阶段需确保模型选择、参数配置与环境一致性;分析阶段需评估难度、可区分度与稳定性;发布阶段需保障材料可访问性与开源规范。该研究为研究人员提供了构建高质量、高可靠、可复现基准的实用指南,助力规避常见问题,提升研究严谨性。
本文基于克里希那穆提《生命之书》的阅读感悟,探讨“活在当下”的实践误区:过度强调“当下”易使其沦为概念,反而远离实相。作者指出,实相无路径可循,唯有心脑单纯清晰时才会自然降临;而真正的自在,需成为“无标签的人”——不依附外在定义,保持内在自察的精神内核。最后强调,觉知实相的状态,是头脑安静却内心充满热情,如熏风、阳光般不请自来。
今天聊聊计算机网络中网络层那些事儿:在TCP/IP分层模型中,网络层起着承上启下的作用,它包含着诸多协议,内容十分繁杂,学习起来属实不易。因此,本文将采用图文的形式拆解网络层中的重要知识点,帮助读者一起过一遍网络层的核心知识。 我选取的教材是经典黑皮书“自顶向下”,同时本文的讲解顺序与原书有所区别。
本文记录基于Go语言实现跳表的完整过程,旨在通过实践深入理解跳表数据结构的核心原理与优化思路。跳表作为一种高效的概率平衡数据结构,通过多层索引实现快速查找、插入及删除操作,时间复杂度可达O(log n)。文中详细阐述了跳表的节点设计、层级构建逻辑及核心算法实现,包括随机层级生成、节点遍历与更新等关键步骤。目前已完成代码开发,相关实现已同步至GitHub仓库,可供参考学习,助力开发者掌握Go语言与高级数据结构的结合应用。