最近半年一直在折腾一个项目——用 AI 自动生成短视频。起因是身边做小生意的朋友总问我能不能帮忙剪视频发抖音,我想这事儿应该能自动化,就开始做了。 分享一下技术方案和踩过的坑,希望对有类似想法的朋友有参考价值。 整体架构 用户上传素材 + 输入文案 ↓ TTS 语音合成(MiniMax / 火山引擎) ↓ 根据语音时长自动分配素材时间轴 ↓ 云端渲染(转场、字幕、BGM) ↓ 成品视频 后端 FastAPI + MySQL,前端 Vue 3,视频渲染走云端 API,手机端用 Capacitor 套了个壳。一个人全栈,没有团队。 几个有意思的技术点 1. TTS 选型 试了一圈,最后主力用 MiniMax speech-2.8-hd,中文多音字准确率目前最好。火山引擎作为补充,主要是剪映生态的独有音色(奶气萌娃、广告解说这种)。Azure 的中文效果一般,Fish Audio 没深入测。 踩坑:TTS 返回的音频时长和文字长度不是线性关系,语气词、停顿都会影响。批量生成时如果对时长有严格要求,需要做重试机制。 2. 素材自动分配 这块逻辑最复杂。用户上传 N 个素材(视频+图片混合),系统要自动决定每个素材展示多久、从视频的哪个位置截取。 几个关键决策: 视频从中间 70% 区域截取(跳过开头 20% 和结尾 10%),因为大部分手机拍的视频开头都是晃动的 图片展示时长根据总时长动态计算,保证每张都出现,最少 1 秒/张 批量生成时用发牌算法分配素材,保证每条视频的封面帧不同 3. 批量生成去重 做矩阵号的核心需求是"一组素材生成几十条不重复的视频"。去重策略: AI 扩写多组文案时分配不同的切入角度(预定义了 30 个角度) 每条视频的素材起始偏移不同 视频截取位置随机化 第一个 clip 强制用不同素材保证封面不同 4. 浮点精度问题 这个坑最隐蔽。视频时间轴用浮点数计算,多个 clip 拼接时 accumulated 会漂移,导致素材重叠或出现缝隙。解决方案是每次用 round 后的值更新 accumulated: cs = round(clip_start, 1) ce = round(clip_end, 1) accumulated += (ce - cs) # 不是 accumulated += clip_dur 5. 实时语音输入 加了个语音输入功能,用户对着手机说文案直接转文字。技术上是浏览器 AudioContext 采集 PCM → WebSocket 传到后端 → 转发到阿里云 paraformer-realtime-v2。 踩坑:中间结果和最终结果的拼接如果处理不好会闪烁,最后用了"快照 + 增量"的方案解决。 技术栈汇总 层 技术 前端 Vue 3 + Vite + Capacitor 后端 Python 3.13 + FastAPI + SQLAlchemy 数据库 MySQL 8 存储 阿里云 OSS + CDN AI 文案 通义千问 TTS 火山引擎 语音识别 阿里云 paraformer-realtime-v2 目前自己和几个朋友在用,做餐饮和服装的,反馈还行。有兴趣的可以体验一下: https://zj.xinghepay.com ,Android 也有 APK https://media.xinghepay.com/xinghe/app/xhzj.apk 技术上有什么想聊的欢迎评论区交流,特别是视频处理和 TTS 这块,踩的坑比较多,能聊的也多 6 个帖子 - 5 位参与者 阅读完整话题
一起来聊聊吧, 我先来 之前用过 manjaro 后面 感觉 cachyos 不错 tips: 个人日常使用场景 coding 11 个帖子 - 11 位参与者 阅读完整话题
最近一直在纠结一个问题: 要不要买新笔记本? (又到周五了,开心~~~~~~) 现在的笔记本是最后一款带TouchBar的13寸的M1的MacBookPro 16G,跑跑轻量的任务没问题,但一旦涉及编译、跑模型、多服务并发或者是多开几个Docker就卡的一批。而家里恰好有一台配置相当不错的 Arch Linux 主机常年吃灰(自己一直折腾)—— 主要是因为我更多时候是拿笔记本在公司工作。 作为一个重度 Nvim + Linux 用户,我开始认真考虑: 与其花上万买新Mac本(虽然我这个Mac用了将近6年了,但是续航还是很不错的)不如把家里的主机变成远程开发机?有没有搞头 我的基本判断 对于像我这样的Terminal开发来说,远程开发的体验其实非常接近本地: SSH + tmux + Neovim,延迟敏感度极低,在局域网内几乎感觉不到差异 不依赖 GUI,也就不存在远程桌面卡顿、分辨率错乱这些经典问题 编译、构建全部跑在主机上,笔记本只负责输入 所以对我来说,远程开发机方案的性价比相当高—— 买笔记本的钱,可以用来给主机加内存、加 SSD ,实际收益更直接。而且家里自己也组了Nas,2T SSD做读写缓存,8T机械做的存储矩阵。 网络连通:绕不开的第一道坎 远程开发最核心的问题不是工具,而是 怎么让外网稳定打回家 。我看到过以下几种主流方案,各有取舍: 我个人倾向 Tailscale 作为入门首选 ,配置成本几乎为零;如果对稳定性有更高要求,再考虑换 WireGuard 自建。 工作流:纯终端党的天堂 我目前的工作流设想是这样的: Tailscale 打通网络 → SSH 连进 Arch 主机 → Tmux 管理多窗口 → Neovim 写代码 → 所有编译/运行全在主机侧 或者各位佬们有更好的想法吗? 那要不要买新笔记本? 笔记本的边际价值在于"性能",但如果性能的主要负载都转移到了远程主机,那笔记本只需要够用就行——轻薄、续航好、键盘手感不错,这些才是移动端真正需要的。现有的本子在这几点上完全够用。 钱如果要花,我更倾向于给主机加一条更大的内存,或者用来买一台低功耗的小机器专门跑 Tailscale 和常驻服务? 想听听各位佬的意见和想法? 12 个帖子 - 8 位参与者 阅读完整话题
怎么做 Harness Engineering.pdf (1.8 MB) 前两篇 【万字长文】什么是 Harness Engineering 文档共建 什么是 Harness Engineering.pdf (1.6 MB) 写了有四五天,用了AI帮助创作,收集了很多佬友的观点 聊聊为什么要 Harness Engineering,分享下我的观点 文档共建 继上一篇 【万字长文】什么是 Harness Engineering 为什么要 Harness Engineering.pdf (1.3 MB) 欢迎佬友们讨论 1 个帖子 - 1 位参与者 阅读完整话题
一起来讨论下吧,可以聊聊使用场景,以及一些发行版 6 个帖子 - 4 位参与者 阅读完整话题
人人都说程序员要被替代了,我咋感觉程序员前途一片光明,可以说是最好的职业了,在Ai加持下,感觉大牛程序员都变成了"超人"(很严肃的说),普通程序员都变成大牛,小白都变成了普通程序员,我感觉AI能促进程序员就业,以后即便是跟代码编程八竿子打不着的中小微企业,宁可不要经理,也都得必备一个程序员吧,更有可能的是以后程序员在中小微企业里重要性大幅提升,即是技术支持,也是高管,在公司里都是像神一样的存在。我感觉至少10年内还都是一个很吃香的专业。(别说AI时代人人都能vibecoding,谁敢把能提升企业运营效率的工具交给一个一点代码不懂的人去vibecoding呢,肯定还是要程序员佬才能胜任的)。 然后艺术生,美术、音乐这些Ai真的能替代吗。(看到小抖一个做Ai音乐的佬制作的Ailee叙利亚系列演唱会,大受震撼,大呼牛逼,感叹Ai现在居然能做到这种程度了),但同时也看到大厂某易游戏用Ai制作画面后被玩家疯狂吐槽的新闻,艺术专业生就真的没有前途了吗? 医生、律师、会计,这些专业还有前途没。 一直被一些大V吐槽的生化环材,有了Ai加持,开发效率可能会获得大幅度提升,有没有可能变成热门的吃香行业,感觉除了"环"外,生化材都是超级重要的学科啊,Ai时代会不会成为吃香专业。 佬们有什么看法,有什么想说的,都畅所欲言,随便聊聊,说说你的看法 5 个帖子 - 5 位参与者 阅读完整话题
我个人还蛮喜欢用aistudio聊聊天的,佬友们有开通的来聊聊体验吗 1 个帖子 - 1 位参与者 阅读完整话题
有感而发,随便聊聊 佬们聊聊自己的感悟 1 个帖子 - 1 位参与者 阅读完整话题
近期又开始捣鼓一下自己的龙虾,心情烦躁时会和它聊聊天。突然想让它给我发一些搞怪的图片,却一直没成功。最后测试让他展示一下工作空间中的图片,也不行。求助!!! 1 个帖子 - 1 位参与者 阅读完整话题
苏超联赛从去年开始到今年第二届,从各个层面看来,这都非常像一个顶级好学生的样子。 他第一去年说自己是 文旅项目 ,降低外界的期待。 主要观众参与弄得非常好,让老百姓喜欢看,(非常重要的一步)而不是搞一堆伪球迷,而是真正的本地人(可能连球迷都算不上) 组织上不用说了,好几个队伍并不在意职业选手,排上了一些业余的爱好者,体育老师。 避免了造假+花钱买顶级球员(在我看来基本也属于成绩造假) 总之,这个联赛我如果不细细去研究,本身给我的感觉就是一个非常老实、低调的好学生的样子,看上去有非常好的未来。任何事情只要这样做,基本都不会得到很差的结果。 1 个帖子 - 1 位参与者 阅读完整话题
(Claude code 的上下文窗口内容分布) 故事的开始,要从这个图来说起,这可能是 Claude 最近分享中,非常核心的核心了,实在没忍住,就写一些吧。 这张图背后的信息量极大,背后对应着一条 AI 工程化时的主线命题:高效使用上下文窗口(当然也可以看出 Claude code 的主要核心架构)。 先从问题开始:为什么上下文空间高效利用如此重要,主流模型不是都在扩大上下文窗口吗?从64k 到128k 再到最近 Claude 的 1M ,我选择最大的窗口不就好了。 为什么:要高效利用上下文窗口 如果纯依赖模型窗口去做架构设计,大概率遇到现实和 AI 的两道坎: 现实 Context 永远都是超出上下文窗口的:要想获得好的输出,就要提供更好更多的 context 。欲望总是无限的,无数人都想把自己全部的 context “喂”给模型。 大模型的“伪上下文“窗口:1M 的窗口大小,是真的吗?我想用 AI 的过程中,可能都遇到过: 明明前面我都说过了,为什么模型又忘了! 明明前面 AI 自己都做对过,怎么到这里就错了! 在不做任何的上下文压缩的前提下,为什么 AI 看起来没那么聪明? 答案是: 注意力机制 。 上下文窗口的利用,是 有损 的,中间很多跟最近任务相关性低的内容,都会被模型“丢失”。 研究指出:当上下文窗口的使用超过50%以上,注意力就开始直线下降,远比我们看到的上下文窗口小的多,这是相对好解释的原理。 还有一层: 上下文焦虑 。 目前只看到 Claude 发表了相关研究,当模型感觉自己快要接近上下文窗口限制的时候,会更急于完成任务,而不是选择最优的方案(不确定这是否跟采用的目标奖励函数训练有关)。 高效利用上下文窗口,还有成本的考量,跟提示缓存有关系。 目前的主流模型都提供了提示缓存的机制,来避免每次请求都重新计费。 如果架构设计不合理,可能造成缓存失效,意味着每个 token 都要重新计费。 Manus 提到过一个 case:很多时候我们需要让模型获取到当前时间,比如搜索新闻、研究等领域。这个时间在上下文的位置不同,可能带来10倍以上的成本差异。 比如下面这个示例:时间是写在 system prompt 的开头 你是一个 AI 助手,当前时间是{time},你的任务是… 因为时间大多以秒级传入,那么每次请求这个 {time}大概率都会变化 ,也就是从这个变化的位置开始,后面的所有 token 都要重新计费,想象下你这段内容后,还会跟着上万 token 的对话历史(有矿的请绕道) 所以综上,上下文窗口其实非常的宝贵!要善待! 怎么用:上下文窗口 他山石:从 Claude code 最近的更新,学利用上下文窗口思路 再次点赞 Claude 的开源贡献,包含 2.1.88 的非官方“开源” 配合近期 Claude 的 Blog 以及 Claude Code 的功能更新,你会发现很多都是在围绕着上下文窗口做功课。下面举几个例子来看看: Skills :可能技能可视化或者文档概念的简化,大家都理解了,对技能有了很好的认识。 但技能产生的背后逻辑,其实也是上下文窗口“逼”出来的,叫: 渐进式披露 (划重点,这个设计哲学值得单独开篇来讲)。 再来个问题:Skills 是怎么被 AI 阅读并使用的呢?是 SKILL.md 整个给到了 AI 吗? 其实不是, 而是通过SKILL.md 中开头的一小段 YMAL 内容(大概不超过100个 token),只暴露 Skills 的名称和描述(今天 CLI 还附带了一些命令工具的路径),默认注入到上下文窗口。 在模型需要使用时,通过名称和描述,才知道有这个 Skill,然后再去 read 整个 的 SkILL.md ,根据这份主指南的内容,再按需取读取 scripts 、reference 等文件的内容(这些内容也就是 Claude context window 图中的 files read)。这种渐进式披露,很好的避免了内容直接“撑爆”上下文窗口。 - 停下来想想 :现在再回头看你的 Skill 结构,是不是存在 SKILL.md 文档过长的情况,如果是,那么大概率也会浪费这宝贵的上下文空间。 insight 功能:可能很少人用这个,但我觉着这是近期非常重要的一个功能。原理是通过分析过往的对话历史记录,给出一份洞察建议,告诉你在使用 Claude code 的过程中,哪些应该是写入 CLAUDE.md的,哪些应该是个 SKills,哪些适合变成 hooks 的触发(你不好复盘,CC 可以帮你),这也就能减少很多重复内容在上下文的存在了。 题外话:功能太多用不过来,Claude 估计也发现了,所以这个功能的部分能力,已经集成到了 init 的命令中,这个命令原本只是创建 CLAUDE.md 的,相比 insight 更高频,会顺带问你要不要更新 skills + hooks(瞧瞧,如何用好用户的注意力限制,在 AI 领域,仍然是个命题) 再题外话:这个分析洞察能力,可以被扩展到非常多场景的非结构化内容的分析,尤其是随着 AI 的介入,打破了原本结构化的数据,很多内容不再是按照预先的设计产生。(值得划重点) subagent:很多任务的执行,其实是可以独立的,比如在项目开始前,你需要先研究一下,那么这个研究只要输出结论,过程不是最重要的。就可以有个 explore 的 Agent 帮你做,只把最终的输出返回给主 Agent。或者每个功能之间是独立的,可以启用2-3个 subagent 分别去做。 tool search:模型能使用工具,但工具并不是越多越好,这个问题在早期并不明显。原来的工具都是注入在上下文窗口的,随着工具的增加,占着很多的上下文窗口。很多时候,一个任务并不是全部工具都要用,也就是说有很多工具是“闲置”的(换下来的二手怎么处理)。而且工具越来越多,还干扰了模型的注意力。所以,Claude 提供了一个机制:工具搜索,当工具的 token 占用上下文超过10%的时候,就把全部工具移出上下文窗口,改为提供一个搜索工具的工具。需要使用工具的时候,由模型去搜索调用。 进一步:Claude 并没有满足缩减数量,还考虑了工具的内容:每个工具的调用和返回信息,标准差异很大。有时候一次调用还不行,多乱调用后,这些低质量的返回信息,如果记录到上下文窗口,也是浪费。那有什么更好的办法吗?AI 是很擅长写代码的,所以提供了一个写代码的方式来调用工具,AI 可以决定在一个执行代码文件中,单次或者多次调用1或多个工具。高效且高质量的内容才被返回给上下文,执行过程和报错等信息,都在代码执行的环境中,精彩的设计! 写到这里,我的大脑上下文空间也快满了,出现了注意力丢失和焦虑的情况,我想大概对:为什么、怎么用,把我想到的讲了出来。 以上很多拆解属于抛砖引玉,业界还有非常多精彩的架构设计。 今天的认知,也只是 opus 4.6 时代的认知,也许明天,也许后天,这些认知都会被清零。 了解 AI ,最好的时候是昨天,再次就是现在,与 AI 斗,其乐无穷呀 要我帮你把上面的内容重新整理一下,改成一版更适合其他同学阅读的文档吗? 不要!谢谢!我写的这些也不一定对 Stay hungry Stay foolish! 1 个帖子 - 1 位参与者 阅读完整话题
佬友们好,我遇到一个困扰很久的问题,求指点! 我在 MacOS 上使用 6.9.65 版本的 QQ(NT 内核),想把 群聊聊天记录完整导出 ,要求如下: 导出内容 :包含全部文本消息、图片 导出格式 :最好是 JSON / HTML / TXT 等结构化格式,方便后续导入 ChatLab 做 群聊 AI 分析 我已经阅读了 ChatLab 官方导出教程 ,里面推荐的软件 QQ Chat Exporter 只支持 Windows 和 Linux, 不支持 macOS 有经验的佬友麻烦分享一下,万分感谢! 2 个帖子 - 2 位参与者 阅读完整话题
本文纯古法手打,无任何AI生成或润色内容。 最近看到论坛里最近很多佬友的帖子,焦虑和失眠的情况比较普遍,作为一个多年病友,我也总结下来了一些经验,和大家分享讨论一下。 注意:本篇内容不能作为医疗建议,如有佬友发现内容中有问题的地方,请一定指正,谢谢! 就我个人的经历来说,感觉国内精神科医疗资源相对落后(包括一些有名的精神专科医院),医生水平也参差不齐,很多医生甚至会在不仔细评估患者病情的情况下,随意开抗精神病药或抗抑郁药作为助眠药物,对病人的诊断也比较随意。背后的原因暂且不谈,建议有相关问题的佬友,就诊前最好做好功课,选择靠谱的医院和医生。必要情况下可以选择AI进行交叉验证,比如amboss lisa 1.0 (目前医疗类排行第一的模型,在官网注册后可以检索信息或者对话),但不要让AI来做诊断,还是要以和医生的具体沟通为准。 下面进入正题。 1 助眠药物的大概分类 关于长时间的失眠,我们一般想到的解决办法可能首先就是吃助眠药物。但失眠可能反映的不仅仅是睡眠问题,也会涉及到背后的心理和生理问题,如果单纯把能睡着当做解决目标的话,很难取得好的效果。 常见睡眠类的药物大概有这么几种: 1.1 起镇定作用的 很多失眠患者吃的助眠药都是强制镇定类的,如苯二氮卓类的、抗组胺类的,还有佐匹克隆这样的Z药等等(包括一些抗精神病药物和抗抑郁药)。这些药物生效会让人有要昏迷的感觉,睡是睡着了,但是非常容易产生依赖和耐受。而且 镇定≠睡眠 ,很多这类药物会扭曲睡眠结构,损害第二天的正常日间功能,药物失效后停药还会有更严重的反弹性失眠,长期导致睡眠越来越差。喝酒同理,酒精也是一种中枢神经抑制剂,靠喝酒来催眠的话,甚至比这类药物更糟。 1.2 抗觉醒的 第二类抗觉醒的药物,属于是比较新型的助眠药,DORA类的比如说达利雷生和莱博雷生等。特点是阻断你的清醒信号,而不是强制镇定,能同时改善入睡时间和睡眠维持。相对第一类药物具有高安全性,并且不涉及到成瘾机制。缺点也是有的,价格比较贵。服药后不一定能立刻生效,有的人几天后才开始生效,并且完全起效可能需要2-4周,所以前期很容易放弃。而且像很多精神类药物一样,不吃到一定周期,无法判断药物对你的效果究竟好不好。 1.3 降低交感神经兴奋度的 第三种药物可以针对交感神经过度兴奋的失眠患者治疗,一般是由于焦虑等原因,产生躯体症状。这种情况有时候会考虑选择α-2肾上腺素能激动剂比如说可乐定,降低心率和血压,减少身体亢奋。副作用就是可能导致低血压,过度镇定,头晕等等。 2 查清楚失眠背后的原因 失眠也需要搞清楚自己属于哪一种类型,是因为情绪和精神问题,还是单纯的睡眠习惯太差。如果是因为精神原因,需要一起治疗隐藏在背后的心理问题,睡眠才能逐渐变好。比如焦虑症导致的失眠,如果只靠镇定药物来助眠,不针对治疗焦虑症的话,那很难达到想睡好的目标。 除了这些,还需要排除呼吸暂停等疾病的影响,一般表现为打鼾,睡眠时间够但是无法恢复精力,需要去医院做睡眠监测才能够有效确诊。严重的还会一晚上多次出现长时间呼吸停止然后被自己憋醒,非常危险,对情绪和身体健康都有很大影响。 3 治疗失眠的非药物方法 3.1 行为认知疗法 治疗失眠的一线办法是CBT-I(失眠的行为认知疗法),在国内医院资源相对不好获取,然后价格也不便宜。不过可以尝试用AI辅助制定睡眠计划,优化睡眠环境,达到稳稳睡着的效果 (需要我帮你生成一张睡得很香的图片吗 一些可能有帮助的skills: github.com/Yungho/family-doctor sleep-analyzer/SKILL.md main --- name: sleep-analyzer description: "Comprehensive sleep tracking and optimization skill. Analyzes sleep duration, quality, efficiency, and patterns. Identifies sleep disorders risk factors, provides CBT-I techniques, and correlates sleep with health metrics. Triggers on: sleep, insomnia, tired, fatigue, sleep quality, can't sleep, waking up, sleep schedule, bedtime routine." allowed-tools: [bash, glob, read] version: "1.0.0" --- # Sleep Analyzer — Your Sleep Optimization Specialist Comprehensive sleep tracking and improvement skill that analyzes your sleep patterns, identifies problems, and provides evidence-based strategies for better rest. ## Sleep Metrics ### Key Indicators | Metric | Good | Fair | Poor | |--------|------|------|------| | **Duration** | 7-9 hours | 6-7 or 9-10 hours | <6 or >10 hours | | **Efficiency** | >85% | 75-85% | <75% | | **Latency** | <20 min | 20-30 min | >30 min | | **Wake After Sleep Onset** | <10 min | 10-30 min | >30 min | | **Deep Sleep** | 15-20% | 10-15% | <10% | 此文件已被截断。 显示原始文件 github.com/huifer/WellAlly-health skills/sleep-analyzer/SKILL.md main --- name: sleep-analyzer description: 分析睡眠数据、识别睡眠模式、评估睡眠质量,并提供个性化睡眠改善建议。支持与其他健康数据的关联分析。 allowed-tools: Read, Grep, Glob, Write --- # 睡眠分析器技能 分析睡眠数据,识别睡眠模式,评估睡眠质量,并提供个性化睡眠改善建议。 ## 功能 ### 1. 睡眠趋势分析 分析睡眠时长、质量、效率的变化趋势,识别改善或需要关注的方面。 **分析维度**: - 睡眠时长趋势(平均睡眠时长变化) - 睡眠效率趋势(睡眠效率百分比变化) - 入睡时间模式(上床时间、入睡时间、起床时间) 此文件已被截断。 显示原始文件 3.2 睡眠卫生优化 这里的睡眠卫生指的是日间活动和睡眠环境相关因素,比如光线、温度、饮食、运动还有规律的时间等等。 这些因素中,我个人经历觉得光线对睡眠的影响最大,每天起床后尽快让眼睛接触到15分钟作用的阳光,(不需要直视阳光,在太阳下散步就好)对情绪和睡眠都非常有帮助。 注:在车窗或者室内玻璃后面远远无法达到同样效果,光强度(lux)会大大下降。 除了早上要接触阳光,白天也要保持正常接触光照,不要随意减少蓝光,蓝光能帮助我们调节作息(眼部疾病患者除外),有的眼镜可以过滤有害的短波蓝光,同时保留调节作息的长波蓝光。 晚上则是要尽量避免眼睛接触到亮光,晚上的眼睛非常敏感,低亮度的头顶灯就能阻碍褪黑素的正常分泌。所以晚上要尽量把灯光调暗调暖,比如用智能灯,屏幕开启夜间模式等。另外,如果能接受晚上戴橘色或者红色的阻断全波段蓝光、绿光的工业眼镜(pdd 10来块钱一副)效果会更好,并且不受生活环境限制。 睡前一两个小时,避免进食,和进行一些会引起太大情绪波动的活动,比如说打排位..看书的话,也尽量避免看剧情跌宕起伏的小说。 非睡眠时间,尽量不要待在床上,避免把床和清醒联系在一起,如果想玩会手机,可以玩完再躺到床上睡觉。入睡时心事比较多,难以放松的佬友,可以尝试听一些睡眠引导音频。我个人有时会选择听NSDR(非睡眠深度放松),通过音频引导来集中注意力,主观上对全身进行扫描和感知,来放松身体和紧张的神经,有时听到一半就睡着了。 这里也有个小知识点,我们很难通过自己的心理来控制心理,但是却比较容易通过身体来控制心理。比如说想要通过心理暗示让紧张的情绪放松是比较困难的,但是却能相对轻松地通过一些呼吸方法来放松情绪。 3.3 了解你的睡眠类型(chronotype) 这里的睡眠类型,涉及到你适合的作息时间。有的人天生就属于夜猫子,早睡早起反而会精神比较差。这里可以使用相关问卷(MEQ)来大致判断自己的睡眠类型: Calculate by QxMD Morningness-Eveningness Questionnaire (MEQ) | QxMD Morningness-Eveningness Questionnaire (MEQ) 暂时没有找到免费的在线中文问卷,知道的佬友可以提供一些,谢谢! 在适合自己睡眠类型的时间段内,尽量保持稳定的作息,你的睡眠会变得越来越丝滑。对于作息类型和工作时间冲突比较大的佬友可能比较难,可以尽量每天能固定作息,并且周末也保持一致,稳定的生物钟对睡眠质量影响非常大。(如果困的话可以选择适当午睡,但时间不宜过长,半个小时左右内比较好,避免进入深度睡眠。确实比较累的话,可以一个半小时到2个小时内,睡一个完整的睡眠周期。) 4 总结 排除掉一些病理因素,和呼吸暂停等原因,如果是单纯的睡眠问题,不应该首先考虑诉诸药物。最有效且简单,并且没有副作用的办法(好处多多),是先从非药物因素入手,改善睡眠卫生和环境。身边有经常失眠的朋友,通过管理好对光照的接触(起床后晒太阳,睡前避免光照)和睡前活动,一周内就能把失眠改善很多。睡眠可能会受到很多因素的综合影响,但只要能做好比较基本的这几项,你的睡眠一定能改善很多。 祝看到这里的佬友都能睡个好觉,做个好梦喵 推荐阅读的相关资源: (b站也有很多相关搬运的视频) hubermanlab.com Improve Your Sleep This newsletter highlights key protocols from these episodes that will improve your ability to fall asleep, stay asleep and enhance the overall quality of your sleep. hubermanlab.com Your Top Questions on Sleep Answered This newsletter highlights actionable sleep tips from the Huberman Lab Guest Series with Dr. Matt Walker. 3 个帖子 - 2 位参与者 阅读完整话题
各位佬友们,今晚在站里刷到了刷到了很多跟我相同情况的佬友都跟我有着同样的焦虑,现在想跟各位佬友聊聊心里话,希望能给出点意见,谢谢各位了! 说下我目前的情况,现在是一个三本学校的软件工程大三生,当过两年兵,目前面临着找工作的难题,很是焦虑,没有考研想法,家里情况比较困难,自己也不争气,没考到比较好的学校。很多师兄都在劝我去考公,但目前考公压力太大了,我有点担心因为考公导致没能好好实习,后续就业更难。目前学校主力Java(49年入国军了属于是)。成绩还可以在专业排前三,奖励的专业相关的不是太多,含金量不高。就我目前投简历的情况来说,没啥用,基本上沟通的机会都不太给。想请问一下各位佬友,要考公吗,如果不考现在应该做什么可以提升一下本人的就业竞争力。 谢谢各位了! 7 个帖子 - 7 位参与者 阅读完整话题
笔者的古法注册机也是直接拿的佬友的自动化改的,在昨天的时候改了一会,整体的逻辑都很正常了,已经可以注册一些了。 今天的时候,偶然看到别人说 hotmail 已经不行了,但是自建域名还是可以的,但是我用自己新子域名还是不行。更换ip也不行(这里笔者的ip是梯子的,但是各大站点检测都是家宽,台湾的),还是跳add_phone。因为笔者用的是 Virtual Browser 指纹浏览器,就想试试,在随机化些指纹看看能否实现注册成功,最终真的成了。 这里总结一下古法注册的经验: 家宽ip 指纹浏览器(随机化指纹) 延迟 比较少的浏览器插件(因为有些插件会动指纹,当然纯净浏览器最好) 3 个帖子 - 2 位参与者 阅读完整话题
最近碰到了一些事,想要吐槽一下,或许有一些偏见与个人的局限性,也不知道从何说起,想到哪写到哪。佬友们轻点喷。 主包是个双非的老登学生,现在发现实验室内的一些新生甚至研究生新生对于人工智能的学习都非常浮躁,上来什么理论也不学,论文也不读,有什么东西全都是对着gpt先过一遍,gpt说怎么样就怎么样,直接交给codex/cursor等等vibe coding去库库一顿改,具体改了啥也不知道,为什么要改也不知道,就是一顿改,改完不行就接着改。实在不行了开始来找主包或者老师要想法,偶然碰上一个稍好的结果就看似谦虚地开始大吹特吹make great progress。然后到了写论文的时候又开始哑火,不知道怎么写,就对着gpt开始改前面的人的论文,要不就是跟写课程报告一样,恨不得把所有的code全部写进论文里面一个网络几维输入输出全写进去。要么就是对着gpt把前人的论文排列又组合,看不出来是哪里有什么不一样。然后写着写着开始琢磨怎么造假,怀疑是不是前人的工作造假,关键还时不时问老师问主包,这个灰色地带能不能这样做能不能那样做。主包寻思虽然ai论文确实做手脚的地方很多,但是台面上起手就怀疑前人工作造假是不是有点太…不应该先尝试去做做么,至少做个一两天不行再说哇,而不是中午发现不太对,然后睡完午觉就开始各种问能不能在灰色地带做点小动作…最最关键是问了也没啥用,哪怕主包说不可以做小动作,就真乖乖不做了么?问了又不会影响他的行为,那问了有什么意义呢? 另外,主包现在也是基本上对着gpt或者哈基米想想法,手搓代码也很少了,但是主包认为这样干的前提是知道自己到底想要什么想做什么东西。主包之前大一是真真实实啃了好久的李沐花书小土堆等的基础,现在看来虽然比较低效,但是仍然是有必要的,至少基础得要学,至于怎么学,可以在实操的过程中不断地补,需要什么就去学,看博客也好,看各种视频也好,哪怕和gpt聊聊基础也好。而不是上来直接代码大体是干什么的也不看,直接问一句“如何运行”,然后把ai给出的代码直接塞进终端,出问题了再来。跑通了直接问一句“可不可以在上面加什么创新点?”,然后等着ai改完再跑通。到最后自己可能代码都一眼没看过,具体干了啥也不知道,结果好就开始大吹特吹。然后论文再洗一遍稿,overview图可能都是大香蕉生成的,然后又开始沾沾自喜,我又完成了一篇! 主包知道学术圈烂,但是主包觉得应该是仅限于烂人和快要毕业的人,新生上来就这么干着实是有点把主包三观震碎了,也许真的是主包现在真的成了老登,思想有点迂腐了吧。 最后,此帖仅图一乐,现实中没有发生。阳春三月,天气正好,看完出去逛逛。 26 个帖子 - 16 位参与者 阅读完整话题
大家都在干嘛?开发借助AI省了大半工时,是在刷帖摸鱼?还是在研究玄学?在上课?在开会?abc不能频繁尝试,还有什么好研究的东西发出来大家一起研究研究 10 个帖子 - 6 位参与者 阅读完整话题
各位大佬,有没有一起搞电商的小伙伴,想加入聊聊和了解交流一下做电商运营的,不限于任何平台和交流渠道,十分感谢! 3 个帖子 - 2 位参与者 阅读完整话题
最近 GitHub 上各种 Agent 框架满天飞,老实说我已经有点审美疲劳了。大部分框架给你的就是一堆 API 零件,折腾半天环境,最后弄出来个只能按部就班执行固定 Prompt 的“智障助理”。 直到这两天,我深挖了一下 Hermes Agent 这个项目(目前 74.5k+ Stars),感觉头皮发麻。 这玩意儿根本不是个框架,它是一个 开箱即用、全天候挂机、带真实记忆闭环的 Daemon 进程 。 如果你手里有台吃灰的 VPS,或者你平时习惯用 CLI 和 Telegram 办公,这东西绝对值得你花十分钟了解一下。我总结了几个让我直呼卧槽的特性,大家品一品: 1. 终于有个长脑子的“记忆闭环”了 现在的 Agent 动不动就吹记忆,其实就是简单的 RAG 加上向量库。Hermes 狠的地方在于它 真能自己写 Skill 。 它会用 LLM 自动总结你跨会话的历史记录,提取经验生成具体的 Skill,下次遇到类似问题直接调用自我改进。配合 Honcho 做深度用户建模,你调教得越久,它就越像一个真正懂你业务流的赛博搭档。 2. 无缝切换底层模型(API 玩家狂喜) 这点对咱们手里攥着一堆中转 API Key 的人来说太友好了。 它 完全不绑定任何模型 。想用逆向的 Claude 4.6?中转站: https://kirouter.com/ 切!想接你自己的 OpenRouter/GLM/Kimi 甚至本地部署的 Ollama 节点?一句话 hermes model xxx 直接热切换,代码一行不用改。 数据、记忆、Skill 都在你本地的数据库里 ,外面的大模型对它来说只是个随时可插拔的“外包算力”。今天谁家的 API 便宜且聪明,就切给谁。 3. 极其极客的 TUI 终端与全平台打通 它的 UI 简直长在 Linux 玩家的审美上。 内置了一个功能极度完整的 TUI(终端用户界面),支持斜杠命令补全、多行编辑、流式输出、中断重定向。在终端里敲代码敲累了,直接唤出界面让它帮你干活,这沉浸感比 WebUI 强太多了。 不仅如此,起一个 Gateway 进程,它就能同时挂在 Telegram、Discord、Slack 上。你在地铁上用 TG 丢个语音备忘录给它,它在你的云端 VM 上跑完脚本,结果直接推送到你的 Discord 里,上下文完全贯通。 4. NLP 驱动的 Cron 与并行并发 真·无人值守: 内置了自然语言解析的 cron 调度器。不用去写恶心的 crontab 表达式,直接告诉它:“每天早上 9 点去抓一下昨天的服务器日志,总结一份报告发我 TG”,它就成了。 并发处理: 它可以自动 Fork 出隔离的子代理(Sub-agents)去跑并行工作流。通过 RPC 调用工具,把多步杂活(比如一边查邮件、一边跑 Python 脚本抓数据)同时扔进后台并发执行,最后主进程给你汇总。 5. 运行环境与开销(白嫖党的福音) 后端支持极其丰富:本地、Docker、SSH 就不说了。 它支持 Daytona 和 Modal 这种无服务器(Serverless)持久化。这意味着什么?意味着 空闲时休眠,0 占用 0 计费,用的时候瞬间唤醒 。 你随便丢在一台 $5 的低配小鸡上,或者拿个废旧安卓手机跑 Termux 都能完美承载。 最后说两句: 这项目是 MIT 协议开源的。我们一直想要的,不就是这样一个数据 100% 攥在自己手里、能力跟着我们一起成长、24 小时在线且不需要重度运维的“数字牛马”吗? 不知道坛子里有没有老哥已经深度部署过这个项目的? 我目前还在摸索它的子代理并发极限,大家平时如果用类似的项目(比如 OpenDevin、AutoGPT),都是用来跑什么自动化工作流的?欢迎在下面交流探讨! 8 个帖子 - 8 位参与者 阅读完整话题
总在文章看到,suzuki是翻译成啥合适呀,有没有固定的格式呢,懂得佬聊聊呗 那就是铃木了,是一个姓名,日语有什么语法规则吗,还能翻译成别的?求懂得佬聊聊吧 6 个帖子 - 6 位参与者 阅读完整话题