Ajax Zhan's Blog
Welcome!This is Ajaxzhan.
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。
本文记录解决JS动态生成Cookie反爬虫的过程,旨在爬取学院新闻公告制作RSS订阅器。反爬机制为:服务器返回加密JS生成Cookie,需二次请求携带Cookie才能获取数据。尝试JS逆向(混淆JS难分析)、Puppeteer/Selenium(被检测为自动化工具)均失败。最终采用seleniumbase库,结合uc参数实现无头模式反检测,成功获取数据。过程中解决Linux环境需安装Chrome(非Chromium)的兼容问题。总结爬虫攻防需灵活应对,经验积累尤为重要。
本文围绕容器与镜像的核心知识展开。针对进程隔离需求,通过Namespace实现进程资源视图隔离,chroot提供独立文件系统,Cgroup限制资源使用,形成容器本质——视图隔离、资源可限制、独立文件系统的进程集合。容器依赖分层复用的镜像(通过Dockerfile构建),运行时由initial进程决定生命周期,数据卷独立于容器保障数据持久化。架构上,moby daemon、containerd及containerd shim分工协作。相较于VM,容器无需Guest OS,轻量且启动快,隔离效果稍弱但正向强隔离发展。
本文分享了Go语言并发编程中的一个常见陷阱:闭包捕获变量导致的数据错误。作者在使用goroutine批量爬取数据时,发现所有任务均处理最后一个用户ID,经排查是因for循环变量在所有goroutine中共享。Go1.22前,闭包捕获的是变量引用,异步执行时循环变量已被覆盖。解决方案包括:将循环变量作为参数传递给匿名函数,创建独立变量;或升级Go版本至1.22及以上。核心教训是需深刻理解闭包机制与变量作用域,避免并发场景下的共享变量问题。
大学生常因错过官网通知(如项目申请、比赛信息等)影响关键机会。传统依赖辅导员或公众号通知存在滞后,手动查官网又费时。RSS技术可主动订阅各网站最新动态,集中至阅读器浏览,解放双手,避免信息遗漏。除学校官网外,还可订阅知乎、CSDN等平台内容,聚焦信息、降低过载风险。使用需两步:获取RSS订阅链接(如RSSHub提供第三方源,作者自建SCU官网订阅源可联系获取)和安装阅读器(推荐PC端Fluent Reader、手机端Feeder)。通过RSS,学生能高效整合学习资源,及时掌握校园动态与学术前沿。
GitHub Actions是GitHub推出的CI/CD工具,通过工作流实现自动化构建、测试与部署。CI(持续集成)指开发者频繁提交代码,自动化构建和测试验证,确保代码库稳定;CD(持续交付)则在此基础上确保代码随时可部署。GitHub Actions核心概念包括workflow(工作流)、job(任务)、step(步骤)和action(动作),通过.github/workflows目录下的YAML文件配置,支持触发条件(如push事件)、任务依赖及环境指定。文章以Vue项目自动打包为例,演示配置流程:拉取代码、设置Node环境、安装依赖、构建项目并上传至artifacts,助力团队高效实现自动化流程。
面对保研内卷加剧的焦虑,作者从斯多葛主义中寻求安宁、自由与镇定的个人哲学。斯多葛主张:安宁即入世与独处时内心平静;自由是独立思考与无约束时的自主;镇定需大事从容、顺遂时自律。核心“控制三分法”强调:专注完全可控之事(如内在目标与行动过程,而非结果),放弃完全不可控之事(避免杞人忧天),区分部分可控之事(关注过程而非结果)。此非逃避,而是积极行动中保持内心安定,为内耗者提供在纷扰中锚定自我的路径。
本文为《动手学设计模式》系列开篇,旨在系统梳理设计模式知识。设计模式是特定环境下解决重复问题的成功方案,广义为被反复使用的代码设计经验总结,分创建型、结构型、行为型三类,可提升开发效率、方便沟通并增强代码复用性与可扩展性。学习需结合UML(统一建模语言)理解类图及类间关系(关联、依赖、泛化、接口实现等),并遵循七大面向对象设计原则:单一职责(类职责单一)、开闭(对扩展开放、对修改关闭)、里氏代换(子类可替换父类)、依赖倒转(依赖抽象而非细节)、接口隔离(定制化接口)、合成复用(优先组合继承)、迪米特法则(降低对象间耦合)。专栏将结合案例与代码实现,帮助读者掌握设计模式的核心与应用。
8月中旬,借参加中国软件杯决赛之机,作者初游南京。因未进第一轮答辩,多出一天游玩时间,与队友打卡钟山风景区等经典景点。南京景点密集需预约,旅游旺季人潮汹涌,加之天气炎热,行程受限。梧桐大道意境美但人多,美龄宫因体验一般未细看,中山陵高处空旷感令人喜爱,孙中山纪念馆让作者对历史与伟人有更清晰认识,明孝陵建筑肃穆、石像路有趣,夫子庙因人山人海仅简单游览。饮食上,当地口味偏淡,鸭血粉丝颇受好评。作者感谢主办方、队友及老师,期待与南京再相见。
星优灵犀-基于讯飞AI的智适应学习平台’针对高等教育课前、课时、课后知识孤岛、评估低效等痛点,以人机共创与社群化学习融合为目标。项目采用前后端分离与微服务架构,深度整合讯飞星火大模型、语音合成等AI能力,构建“三大核心赋能+十大功能”体系:课前提供智能预习、备课及知识图谱;课时支持课堂回放、语句级社群智答;课后实现五维学情评估、闯关式复习及RAG资料问答。通过AI技术全流程渗透,助力高等教育数字化转型,让学习更智能、便捷、高效。
本文档为Linux+GPU服务器上的文档问答系统部署手册,作者结合自身踩坑经验编写,旨在帮助后续开发者顺利部署。核心步骤包括:修改`chatdoc/config.py`中的数据库与API配置;安装Anaconda并创建Python 3.10虚拟环境;配置清华源后安装requirements.txt依赖;根据CUDA版本安装Pytorch、Paddlepaddle及zh_core_web_sm模型;使用tmux管理会话确保服务持续运行;通过`export CUDA_VISIBLE_DEVICES`指定GPU卡号。手册还详细解决了星火Embedding源码修改(解决QPS限制和API版本问题)、Paddle报错处理(如libcudnn_ops_infer.so缺失)等常见部署问题,强调需注意环境变量配置与依赖版本匹配。