坐标山东,最近换季,鼻炎又准时报到了。 现在的状态是: 白天喷嚏不停,晚上呼吸不通。 纸巾擦到鼻子脱皮,脑壳也因为缺氧整天昏昏沉沉。 目前我的日常是: 口服氯雷他定片(作用不大),海盐水鼻腔喷雾器清洗完然后喷糠酸莫米松鼻喷雾剂会缓解一会儿,过了药性又恢复如初了。 想问问大家有没有什么虽然小众但你用了确实真香的缓解手段? 希望大家能分享一下经验,救救孩子。 6 个帖子 - 4 位参与者 阅读完整话题
有没有什么方式或者途径能体验到呢,佬教教 1 个帖子 - 1 位参与者 阅读完整话题
入标题所写,不是那种用于售卖,也不是单个渠道多key 我要的是那种,有个gui,能把多个不同的模型聚合成同一个名字的那种工具,不要newapi,他那个可配置项太少了,还不能配置那个模型被选中的次数,如果报错就换下一个,一个模型最多只用几次这样的内容,有没有有用到过类似的佬友?来问问 7 个帖子 - 5 位参与者 阅读完整话题
不知道这个算啥,感觉是不便宜的,有没有佬来看看,不要问我怎么买,自己去搜关键字 20 个帖子 - 10 位参与者 阅读完整话题
RT,Ark API的限制是什么(例如并发什么的),有没有佬知道的 害怕高并发把号搞没了 6 个帖子 - 3 位参与者 阅读完整话题
RT,这两天有没有仍然可用的codex或者Claude呀,中转站或者公益站都行,或者有没有不太贵的氪金玩法,求各位佬们推荐 18 个帖子 - 14 位参与者 阅读完整话题
apple store有很方便的比价网站,可以看各个区的订阅价格,有针对google play的网站吗?菲律宾土耳其有的订阅价格也很低诶 2 个帖子 - 2 位参与者 阅读完整话题
sk-b1da2a945c2c2d16243f59457f1dfe50681dfb2bf1a4618de4bb803bcc5740f0 ai.dianshangbat.cn Sub2API - AI API Gateway 这使用起来感觉怪怪的,改项目老改的面目全非逻辑混乱,我都无语了,但是我又不会测 是不是真的gpt5.4 xhigh ,来个佬帮帮孩子吧 13 个帖子 - 6 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下全是我自己手搓,没有ai味(我用最真实、最不绕、最直接的方式跟你讲 hhhhh),放心品尝 很多人以为 Skill 迭代最难的是"怎么改"。 但我越来越强烈地觉得,真正难的其实不是改,而是: 你改完之后,根本不知道它到底有没有真的变好。 补描述、调 prompt、加例子、补边界、改结构。 Skill 看起来越来越完整,文档越来越像样,语气越来越专业。 但问题是: 看起来更完整,不等于真的更强。 skill的实际行为未必更稳定,边界未必更清晰,失败处理也未必更好。 所以很多 Skill 维护最别扭的地方,其实不是"不会写",而是你明明已经改了很多轮,却还是说不清: 上一次改动,到底有没有真正产生作用。 我后来专门跑了 100 个高下载 Skill,发现问题并不是"不能用" (是的,烧我自己的token)结果最有意思的地方,不是烂 Skill 特别多。恰恰相反,大多数 skill 其实都能用: 70 个通过 29 个在 caution 区间 1 个 fail 平均分 73.8 真正的问题不是:大多数 Skill 完全不能用。 而是 很多 Skill 停在一个很尴尬的状态:能用,但不容易被继续有效优化。 你一旦想认真往上修,就会发现问题不少,但很难判断到底该先修哪一块。 也就是说,难点不是"没法写",而是 没有诊断,所以不知道怎么有效地继续改。 更关键的是,这种"不对劲"还不是随机的。 我看到的弱点主要集中在几个地方: Trigger quality 平均 6.2 Functional quality 平均 6.6 大约 80% 缺少 not_for 边界 大约 60% 的 D4 弱项 Skill 缺少像样的 error recovery guidance 还有接近 40% 更像"写给人看的说明书",而不是"写给模型执行的操作说明" 这里翻译成人话就是: 很多 Skill 不是坏在"完全不能用",而是坏在几个特别重复的地方:不会划边界,不会处理失败,也没有把行为写得足够可执行。 所以我后来做了 SkillCompass 我想解决的,不是"怎么把 Skill 写得更长、更完整",而是另一件更关键的事: 在你动手优化之前,先看清问题到底在哪;在你改完之后,再验证这次修改有没有真的产生提升。 所以对我来说,SkillCompass 不是一个"给 Skill 打个分"的工具而已。 它更像一个给 Skill 迭代提供方向感的东西: 现在最弱的是哪一维 下一步该先修哪里 这轮修改有没有真的带来提升 有没有把别的地方一起改坏 【这里插一句compass 这个名字,指南针🧭,其实也是这个意思。不是替你做决定,而是先帮你定位方向。 】 所以它背后的设计原则也很简单: 本地优先 :所有数据都留在本机,除非你明确要求,否则不会主动发起网络请求 默认只读 :评估和报告默认不改文件,improve、merge、rollback 这类写入操作都要明确开启 被动追踪,主动决策 :Hooks 会收集使用数据,但系统只给建议,不会自动替你执行 双通道交互 :既支持键盘选择,也支持自然语言查询,两种方式始终都可用 同时我把评估分成了6个维度;把判定标准分成3档 它不是在帮你"多改一点",而是在帮你把迭代变成一个可验证的流程 与其盲目地"再多写一点",不如把 Skill 迭代拆成一个更清晰的 workflow。下面拿agile-product-owner作为一个例子展开讲讲: 1)先诊断 不要一上来就改。先看清楚最弱的是哪一维。 很多时候你以为问题在 wording,实际可能卡在 trigger、边界、失败处理,或者执行指令根本不够可操作。 先把最弱项找出来,后面的修改才不是瞎试。 接着它出一个初步的报告,包含维度1-3,后面会有一个完整的全方位维度1-6的测评报告(看下图): 2)再看单项到底在说什么 我觉得这一步特别重要。 因为很多人一看到分数,会下意识觉得"哦,这项低,那我去多写一点"。 但 SkillCompass 真正有价值的地方,不是只给分,而是会把某个维度为什么高、为什么不满分、它到底在判断什么,说得更清楚。 比如拿 D6 = Uniqueness(独特性 / 不容易被替代) 来说,它看的不是"你这段话写得顺不顺",而是在看: 这个 skill 是不是真的有独立价值 有没有明显重复品 跟相似 skill 重合度高不高 是不是一句普通 prompt 就能替代 它是不是很快就会过时 这里个skill的这一维最后给到 8 分,不是说它不好,而是说:它已经有明确领域专属性,也不太容易被普通 prompt 替代,但还没有强到"极其不可替代"的程度。 3)定点修复,而不是整份 Skill 重写 找到弱项之后,不是整份 skill 重写一遍。 而是只修最该修的那一块。所以我们把弱项加强,不好的修正,但不污染上下文 **这里要敲重点!!!**它做了那段分数解释,并且新版分更高的同时也没有把别的地方改坏,因为修改目标清楚,而且不会为了补一个问题,把别的地方一起搅乱。 此时,SkillCompass 已经完成这轮评估/优化结果的写入(提升了 D5),没有出现回归,然后把新的评估记录和最新扫描时间写进本地文件。 4)改完再验证,千万不要靠感觉收工 改完不能靠"看起来更完整了"就结束。要重新验证这次修改到底有没有带来真实提升。 分数有没有上去,解释有没有更扎实,别的维度有没有被改坏,这些都得重新看。 (((兄弟们,有效的优化才叫"迭代",不然就是屎上雕花。))) 5)再找下一个瓶颈 一个问题修完,不代表 skill 就完成了。 通常是这个瓶颈被拿掉之后,下一个瓶颈才会浮出来。 所以真正有效的迭代,不是一次性改到完美,而是持续地: 诊断问题 → 定向修复 → 验证提升 → 找到下一个瓶颈 这也是我现在更认同的一种 Skill 迭代方式:不是凭感觉打磨,而是把迭代变成一个更可验证的 workflow。 适合什么人,不适合什么人 适合: 任何在维护 agent skills,并且希望质量能够被量化的人 想要有明确改进方向的开发者—不是靠猜,而是清楚知道下一步该修哪个维度 需要质量门槛的团队—任何会改动 skill 的工具,都可以在改动后自动接受评估 安装了很多 skills、想看清哪些真的在用、哪些已经陈旧、哪些存在风险的用户 不适合: 通用代码审查或运行时调试 从零创建新 skill(这个更适合用 skill-creator) 评估非 skill 类型的文件 项目在这里: github.com GitHub - Evol-ai/SkillCompass: Evaluate agent skill quality. Find the weakest… 有兴趣的佬欢迎去 GitHub 点个 star 支持一下。 如果你手上也有自己的 SKILL.md,欢迎直接贴出来,我这边也可以顺手用 SkillCompass 帮你跑一遍测评。 有问题也欢迎一起聊,也可以 fork 回去自己改着玩 2 个帖子 - 2 位参与者 阅读完整话题
如题,想用本子或坡县的1c1g交换个美西的 本着诚实守信的原则 1 个帖子 - 1 位参与者 阅读完整话题
有没有佬知道image2灰度的有什么要求,我这3个free和一个免费一月的plus都没有灰度到 3 个帖子 - 3 位参与者 阅读完整话题
怎么判断模型是不是真的opus4.7,有没有被路由掺水呢 6 个帖子 - 3 位参与者 阅读完整话题
如题,感觉langchain/graph 有点过于封装了 3 个帖子 - 3 位参与者 阅读完整话题
我买一个东西,要看看这个生产企业有没有被曝出剥削员工。一旦有,我一定不可能买。 原因有四: 一.剥削员工就是不把员工当人,一个不把员工当人的企业,凭什么让我相信它能把消费者当人?我不会买这种企业的东西。 二.员工被剥削、压榨,吃不好,受气,一定不可能好好做产品,会搞破坏。不是我把工人想象的坏,我要是那工人,我也会故意把螺丝拧松、把线接错、把焊点虚焊—— 凭什么我遭罪,你卖车赚钱? 没有这种道理。我不会买这种企业的东西。 三.一个剥削员工的企业,我买了它的产品,就是支持它,支持它剥削员工,是助纣为虐,我就成了帮凶。我不会买这种企业的东西。 四.我是工人的孩子,也是工人的预备役。我必须站在工人这一边,绝不能和奴隶主同流合污。我不会买这种企业的东西。 比如某车企在巴西被查出工地(外包)163名中国工人,30多人挤一间、共用1个厕所、无热水无通风,护照被没收、限制自由、克扣工资、长期加班······被巴西官方定性: 类似奴役的劳动 那么我永远不会买该企业的任何产品。 有些人笑了;“人家缺你一个吗?你不买有的是人买。”我要说,我不指望靠我一个人把它买死,我只要求我自己不做帮凶。 我不买,不是为了搞死谁,而是守住我的良心。我也是打工人,我以后也要进厂、也要上班、也要被人管。如果我今天买了剥削工人的企业的东西,就等于我在投票:“可以这么对待工人,我无所谓。”那以后别人剥削我的时候,我连骂人的资格都没有。 我不买,一个人确实没用,但千万个人像我一样,这种企业就死定了。这种人多一个,企业就怕一分。 我不买,就是在平静地告诉所有剥削员工的企业、自甘堕落的工贼: 我鄙视你,我不和你玩,我绝不顺从你。 我不买你的产品,那是你的损失,不是我的。我有自己的底线,这比所有的口号都重要。 这就是我买东西的一个准则。 10 个帖子 - 6 位参与者 阅读完整话题
我现在自己的账号已经完全开不了邮箱了,显示连接不到iCloud服务器,有查到好像大家说他的上限大概是750个邮箱,但是我一般来说创建一个就删掉一个,难道删掉的也会占用750个的额度吗?大家有知道的吗 2 个帖子 - 1 位参与者 阅读完整话题
RT,目前搜索到的大部分都是ClaudeCode 第三方插件 Obsidian,但是习惯用codex之后,实在懒得折腾了…佬们有木有办法? 求指教 3 个帖子 - 2 位参与者 阅读完整话题
有没有佬可以分享一点论文降重和降ai率的方法啊,本科论文,另外有没有做ppt的网站分享 6 个帖子 - 5 位参与者 阅读完整话题
本人在读大三,想问一下一般实习是什么时候实习最好?有没有那种暑假实习两个月的那种。 2 个帖子 - 2 位参与者 阅读完整话题
用的api的,所以不支持claude原生的,有没有好的开源项目能解决这个问题呢? 5 个帖子 - 5 位参与者 阅读完整话题
GCP快到期了,各位佬有没有教程续转移账单,之前没有操作过怕搞错 5 个帖子 - 5 位参与者 阅读完整话题