Ajax Zhan's Blog

Welcome!This is Ajaxzhan.
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。

这是AI时代,也是一个酒神时代——新技术、新产品、新SOTA层出不穷,从传统大厂到创业公司到OPC到每个个体——每个人都在拼了命想赶上这波浪潮。

神奇的是,在感性和理性的拉扯中,我的理性在这一个月里面变得淡了许多,几乎没有占据过主导地位,感性倒是久不散去,给我带来了许多欢乐和痛苦。

只需要将VPN改成虚拟网卡模式,再打开Cursor的HTTP2.0模式就不会有模型被拦截的问题了,很神奇。解决了HTTP1.1网络环境太差的问题。

最近开始意识到一种很重要的能力——幽默,当然这种幽默不仅仅是对别人,更多是对自己的一种幽默。如果一个人都无法进行自嘲和对生活中的事情进行解构,那么这个人绝对会获得特别痛苦和憋屈,更不用说会产生什么有价值的思考了。所以保持一种对自己冷幽默的态度还是很重要。

兼具深度与启发性的分析,能有效帮助培养更敏锐的Research Taste:关于大海捞针是一个很好的评估长上下文的指标——https://www.zhihu.com/question/654570878/answer/1965228622118888157

AI的发展、LLM的发展太快了,落地的推进也很迅速,中国有无数能人志士正在各自岗位推动这件事情。今年看到的太多新闻都给我一种感觉:AI的浪潮不像是泡沫,未来3-5年AI的需求只会增加,不会减少。浪潮之下,要学习的东西还太多太多。

最近把MLLM当作OCR来用,大概就是识别图中的习题然后转成平台兼容的格式。这个过程中发现大模型的幻觉还挺可怕,他要是直接给你很离谱的错误也就罢了,他居然会给你修改选项中的一些细节,并且修改得很合理,让你完全看不出来。这种幻觉在很多领域我认为还是不可接受的,而且关键是怎么检测出来这种幻觉?如果还要靠人为来检测,那这种基于大模型的自动化工作流其实意义就大打折扣了。

今晚回顾了之前支教的照片,感慨颇深。想做一个好的老师,但确实做的不够好。

今天研究了Coze的Multi-Agent、豆包的语音合成大模型、开源的OpenWebUI和NewAPI,感觉都挺牛的,效果很令人振奋,可以试试组合起来做个项目。

同时我现在越来越觉得,不是为了追求技术而技术,而是要用技术做出真正的好产品,注重用户体验和实际价值。真正的好产品实在令人振奋,字节跳动公司推出的豆包语音系列效果震撼,飞书在办公方面做的绝绝子,今天实用了火山引擎的工单系统都觉得很nice。感觉字节的产品都很有灵气。

今晚看了看过去一年的日记,很有感触,记日记真的很有意思,只有通过当时的文字才能观照今日的自己是否已经成长了。我们需要隔一段时间询问一下自己:自己是否激情依旧,是否能留存有过去许下愿望那时的热情?

爬虫攻防:一次js动态cookie的反爬虫解决经历

本文记录解决JS动态生成Cookie反爬虫的过程,旨在爬取学院新闻公告制作RSS订阅器。反爬机制为:服务器返回加密JS生成Cookie,需二次请求携带Cookie才能获取数据。尝试JS逆向(混淆JS难分析)、Puppeteer/Selenium(被检测为自动化工具)均失败。最终采用seleniumbase库,结合uc参数实现无头模式反检测,成功获取数据。过程中解决Linux环境需安装Chrome(非Chromium)的兼容问题。总结爬虫攻防需灵活应对,经验积累尤为重要。

云原生学习01:容器与镜像

本文围绕容器与镜像的核心知识展开。针对进程隔离需求,通过Namespace实现进程资源视图隔离,chroot提供独立文件系统,Cgroup限制资源使用,形成容器本质——视图隔离、资源可限制、独立文件系统的进程集合。容器依赖分层复用的镜像(通过Dockerfile构建),运行时由initial进程决定生命周期,数据卷独立于容器保障数据持久化。架构上,moby daemon、containerd及containerd shim分工协作。相较于VM,容器无需Guest OS,轻量且启动快,隔离效果稍弱但正向强隔离发展。

Golang的这个并发陷阱,让我3分钟内损失了10块

本文分享了Go语言并发编程中的一个常见陷阱:闭包捕获变量导致的数据错误。作者在使用goroutine批量爬取数据时,发现所有任务均处理最后一个用户ID,经排查是因for循环变量在所有goroutine中共享。Go1.22前,闭包捕获的是变量引用,异步执行时循环变量已被覆盖。解决方案包括:将循环变量作为参数传递给匿名函数,创建独立变量;或升级Go版本至1.22及以上。核心教训是需深刻理解闭包机制与变量作用域,避免并发场景下的共享变量问题。

又错过官网消息啦?如何优雅订阅学校官网的消息

大学生常因错过官网通知(如项目申请、比赛信息等)影响关键机会。传统依赖辅导员或公众号通知存在滞后,手动查官网又费时。RSS技术可主动订阅各网站最新动态,集中至阅读器浏览,解放双手,避免信息遗漏。除学校官网外,还可订阅知乎、CSDN等平台内容,聚焦信息、降低过载风险。使用需两步:获取RSS订阅链接(如RSSHub提供第三方源,作者自建SCU官网订阅源可联系获取)和安装阅读器(推荐PC端Fluent Reader、手机端Feeder)。通过RSS,学生能高效整合学习资源,及时掌握校园动态与学术前沿。

CI/CD初探:GitHub Action的使用

GitHub Actions是GitHub推出的CI/CD工具,通过工作流实现自动化构建、测试与部署。CI(持续集成)指开发者频繁提交代码,自动化构建和测试验证,确保代码库稳定;CD(持续交付)则在此基础上确保代码随时可部署。GitHub Actions核心概念包括workflow(工作流)、job(任务)、step(步骤)和action(动作),通过.github/workflows目录下的YAML文件配置,支持触发条件(如push事件)、任务依赖及环境指定。文章以Vue项目自动打包为例,演示配置流程:拉取代码、设置Node环境、安装依赖、构建项目并上传至artifacts,助力团队高效实现自动化流程。

分享:斯多葛哲学的控制三分法

面对保研内卷加剧的焦虑,作者从斯多葛主义中寻求安宁、自由与镇定的个人哲学。斯多葛主张:安宁即入世与独处时内心平静;自由是独立思考与无约束时的自主;镇定需大事从容、顺遂时自律。核心“控制三分法”强调:专注完全可控之事(如内在目标与行动过程,而非结果),放弃完全不可控之事(避免杞人忧天),区分部分可控之事(关注过程而非结果)。此非逃避,而是积极行动中保持内心安定,为内耗者提供在纷扰中锚定自我的路径。

动手学设计模式:七种OOP设计原则是哪些?

本文为《动手学设计模式》系列开篇,旨在系统梳理设计模式知识。设计模式是特定环境下解决重复问题的成功方案,广义为被反复使用的代码设计经验总结,分创建型、结构型、行为型三类,可提升开发效率、方便沟通并增强代码复用性与可扩展性。学习需结合UML(统一建模语言)理解类图及类间关系(关联、依赖、泛化、接口实现等),并遵循七大面向对象设计原则:单一职责(类职责单一)、开闭(对扩展开放、对修改关闭)、里氏代换(子类可替换父类)、依赖倒转(依赖抽象而非细节)、接口隔离(定制化接口)、合成复用(优先组合继承)、迪米特法则(降低对象间耦合)。专栏将结合案例与代码实现,帮助读者掌握设计模式的核心与应用。

南京札记:初见金陵

8月中旬,借参加中国软件杯决赛之机,作者初游南京。因未进第一轮答辩,多出一天游玩时间,与队友打卡钟山风景区等经典景点。南京景点密集需预约,旅游旺季人潮汹涌,加之天气炎热,行程受限。梧桐大道意境美但人多,美龄宫因体验一般未细看,中山陵高处空旷感令人喜爱,孙中山纪念馆让作者对历史与伟人有更清晰认识,明孝陵建筑肃穆、石像路有趣,夫子庙因人山人海仅简单游览。饮食上,当地口味偏淡,鸭血粉丝颇受好评。作者感谢主办方、队友及老师,期待与南京再相见。

星优灵犀项目介绍 | 中软杯国二 | 数智化教育应用平台

星优灵犀-基于讯飞AI的智适应学习平台’针对高等教育课前、课时、课后知识孤岛、评估低效等痛点,以人机共创与社群化学习融合为目标。项目采用前后端分离与微服务架构,深度整合讯飞星火大模型、语音合成等AI能力,构建“三大核心赋能+十大功能”体系:课前提供智能预习、备课及知识图谱;课时支持课堂回放、语句级社群智答;课后实现五维学情评估、闯关式复习及RAG资料问答。通过AI技术全流程渗透,助力高等教育数字化转型,让学习更智能、便捷、高效。

可解释性文档问答系统后端GPU服务器部署文档

本文档为Linux+GPU服务器上的文档问答系统部署手册,作者结合自身踩坑经验编写,旨在帮助后续开发者顺利部署。核心步骤包括:修改`chatdoc/config.py`中的数据库与API配置;安装Anaconda并创建Python 3.10虚拟环境;配置清华源后安装requirements.txt依赖;根据CUDA版本安装Pytorch、Paddlepaddle及zh_core_web_sm模型;使用tmux管理会话确保服务持续运行;通过`export CUDA_VISIBLE_DEVICES`指定GPU卡号。手册还详细解决了星火Embedding源码修改(解决QPS限制和API版本问题)、Paddle报错处理(如libcudnn_ops_infer.so缺失)等常见部署问题,强调需注意环境变量配置与依赖版本匹配。