好多佬友都反馈感觉opus4-7越更新越差劲呢,现在各位佬都一般用xhigh还是max effort的opus4-7呢?我感觉用xhigh快是快了,但是质量不太行呀 7 个帖子 - 5 位参与者 阅读完整话题
在这个时间点,在看这个质量,成本……就像是为了向某些人证明一些什么 也许是我多心了吧 2 个帖子 - 2 位参与者 阅读完整话题
回复速度快得压痞,这回复质量嘛,我懒得喷了,昨晚到现在,在 cc 里用 4.7xhigh 问色盲题几乎一次不对,水果题嘛还能对个一两次。 现在索性换回 4.6max,瞬间舒服了,正确率直线飙升,得嘞,这段时间暂时先老实用着 4.6 叭,4.7 看看后续 A\ 会不会有啥动作再说 附上色盲题: 有一天,一个女孩参加数学考试只得了 38 分。她心里对父亲的惩罚充满恐惧,于是偷偷把分数改成了 88 分。她的父亲看到试卷后,怒发冲冠,狠狠地给了她巴掌,怒吼道:" 你这 8 怎么一半是绿的一半是红的,你以为我是 傻子吗?" 女孩被打后,委屈地哭了起来,什么也没说。 过了一会儿,父亲突然崩溃了。 请问:这位父亲为什么过一会儿崩溃了?他意识到了什么? 2 个帖子 - 2 位参与者 阅读完整话题
IT之家 4 月 17 日消息,AI 编程如今无处不在,任何人都可以在掌握提示词(prompt)的能力下成为 Vibe Coding(氛围编程)开发者。如今 ChatGPT、Claude、Gemini 等工具甚至能直接将一个点子转化为完整应用,并发布到商店。 据科技媒体 PhoneArena 今天报道,AI 智能体确实可以高效开发移动 App,但模型从训练到实际使用往往存在时间差,导致 AI 往往无法掌握 Android 系统的最新变化。这就导致 AI 开发出的应用可能存在 Bug、安全隐患,不符合最新规范。 为解决上述问题,谷歌昨天向 AI 智能体开放最新 Android 开发指南访问权限,同时应用一系列新工具, 帮助 AI 掌握如何构建高质量 Android 应用 。 IT之家附上谷歌官方发言如下: 现在 AI 智能体已经可以通过持续更新的知识库,在 Android 开发文档、Firebase、Google Developers 以及 Kotlin 文档中寻找最新开发规范。即使某些大语言模型的训练数据已经过时一年,经过训练后仍能开发符合当前框架的应用。
目前再蹭codex-free,但是free额度被砍,目前是不够用的,qoder目前每个月有2000+额度,但是代码开发质量实在不堪,有没有佬友给点建议,怎么把两个结合起来用,我的想法是通过codex分析需求,输出方案文档,让qoder开发实施,最后让codex来review代码,但是不知道怎么去落实。 1 个帖子 - 1 位参与者 阅读完整话题
告诉 Gork 我需要你去找到你参考到的好的信息 我顺着链接打开,发现里面的信息大部分质量都挺高的,值得学习 也算是抛砖引玉了,有需要的朋友可以试试。 5 个帖子 - 5 位参与者 阅读完整话题
想请问下各位佬,在平时研发工作中有没有什么好用的奇淫技巧提升gpt模型的能力 平衡思考时间与最终输出质量【公司有报销,不需要关心token消耗】 4 个帖子 - 3 位参与者 阅读完整话题
IT之家 4 月 17 日消息,今天上午,雷军在直播小米汽车新 SU7 续航测试过程中,再次谈及自己 被贴上“营销大师”标签 。雷军直言,这是“黑子们”为了让大家认为小米汽车不是因为质量好、做得好而是营销好才卖得好。他还提到,去年本来都不想直播,但相关负面声音较多,自己觉得还是要站出来,不能不发声。 …… 不是产品好、不是质量好、而是营销好,这就是他们表面上夸我,实际上黑我的本质。所以去年很长一段时间我不想直播、不想参加任何活动,但长时间的负面舆情,确实会影响很多用户对小米汽车的印象。因此,我做了很长时间心理建设,决定站出来 把事实和情况一点一点告诉大家 。 …… 我知道这样做一样会有人黑我,一样会有人说“这是营销”,那他们爱怎么说怎么说去吧,无所谓!我这样做不是要说服那些黑我们的人,而是 让不太了解我们的人更了解小米 。 据IT之家此前报道,雷军曾在今年年初的直播中谈到“营销大师”这一标签。“我搞了一辈子技术,无论是在金山还是小米,一个做了三十年技术的人,被贴‘营销大师’标签,我……”雷军认为,“营销”这个词是个中性词, 并且每家都需要营销 , 但这个词语现在被包装为一个很有攻击性的词 。 相关阅读: 《 小米雷军回应被贴“营销大师”标签:营销不是坏事,但产品是基础 》
两个半小时就把5小时限额蹬完了,用的/effort max,和opus 4.6的max相比,任务完成的速度、质量没有显著差异,不知道是不是我的错觉,4.7似乎更喜欢停下来进行阶段性汇报,以及更新文档。现在比较期待gpt 5.5了,某种意义上4.7不及预期(比降智的4.6好不少就是了) 佬们可以说说自己使用下来的实际感受 5 个帖子 - 4 位参与者 阅读完整话题
最新想弄一个生图网站, 想接入ai模型要质量高些的, 最好也可也支持生成视频 3 个帖子 - 2 位参与者 阅读完整话题
4k世界、蚂蚁4k、音范丝、gying、nullbr都寄了… 现在只有一个seedhub能用 有没有高质量的4k磁力论坛推荐? 实在没精力折腾pt,手头没有nas,而且我感觉pt折腾到最后都是为了刷数据,我只想好好看个电影… 7 个帖子 - 7 位参与者 阅读完整话题
最近导师给了我个活,需要用文生图的模型生成一万多张图片,为了保证质量想用nano banana pro(google/gemini-3-pro-image-preview),请问国内有没有比较性价比高的这种API的中转站的,求大佬推荐。 之前试了下ofoxai,感觉好贵,生成一张图大概要一块钱 4 个帖子 - 3 位参与者 阅读完整话题
我能理解你可能发生了什么机房爆炸之类的极端情况导致没有办法把这个虚拟的轻量云主机给用户稳定运行,但是一想到每天晚上八点到十一点准时开始卡顿、8M带宽只有半夜能跑满、自带的性能监测动不动就占满cpu这些情况,明年我再也不图便宜续费了,我宁可翻倍去买腾讯云原价服务器 1 个帖子 - 1 位参与者 阅读完整话题
本人是某互联网公司的测试开发,最近团队在做 AI native 方向的转型,开发的速度是快了很多,感觉质量有明显的下降,且 QA 团队也比较痛苦,想问下佬友们如何在项目开发中保障产品的质量。 我自己传统的测试点点点、自动化、专项测试、AI 测试等都做过,也自己 vibe 过不少的项目。不可否认,有了 AI 的助力确实做出一个工具、产品非常的快,但是在团队体系里面,迭代一个大型产品, AI 给出的代码质量是不够直接上生产的 ,这就给 QA 带来了很大的困境。 我们尝试过很多,包括但不限于: AI 工作流去从需求生成用例 AI 完成代码变更分析 AI 维护自动化测试框架 现在也在用 AI 去执行测试 公司希望能到 AI 自主的从需求到测试执行,产出测试报告,自己闭环 bug,然后交付出来是高质量可维护的产品。目前尝试过很多方案和工具,但是都没有比较好的解决方案。 说下我自己的一些思考碎碎念 关于测试约束: agent 自己写用例测自己的代码肯定不靠谱,应该是基于需求去写用例作为约束。但这要求需求本身得过硬,关联模块、流程完整性、边界异常这些都得先 review 到位,否则后面全是缝缝补补。需求如果能描述完备就可以作为黄金标准,但怎么评估可测试性,这个还没想清楚。 关于结果可信度: AI 测试的结果能不能信也是个问题。AI 说它测了,真的测了吗?断言靠谱吗?我们现在搭了一套边执行边写代码沉淀 case 的机制,但还是得人去看结果跟需求有没有偏差。不是所有 case 都能交给代码执行的,怎么分工也没有好的答案。 关于 E2E 选型: E2E 测试代码用什么写也纠结,Playwright、Cypress 这种纯 locator 的,还是 Stagehand、MidScene 这种 AI 定位的,还是开发时就加 data-test-id 从源头解决。写出来怎么维护、怎么入库、能不能真的测出问题、指标怎么统计,都还没想明白。 关于后端测试: 前端这套大概有点方向了,但后端怎么做 AI native 的测试?mock 还是真实后端?还是跑 E2E 的时候后端也顺便覆盖了?这块完全没头绪。 关于协作模式: 团队协作模式也想变,不想搞传统流水线了,想做那种任何人提 idea 就自动分析需求、产出用例、自动评审的模式,人只管最后 review 给结论。但产出的东西不能又臭又长,得精简到人能快速看完给判断。怎么落地也还在想。 想问下各位佬友所在的团队是怎么做的,有没有类似的痛点,或者说有一些心得,可以分享讨论一下 2 个帖子 - 2 位参与者 阅读完整话题
用的glm5.1,手动一行代码的事情我看他自己跟自己battle了好久还是改不好,突发奇想是不是可以拿来判断模型质量? 4 个帖子 - 3 位参与者 阅读完整话题
IT之家 4 月 14 日消息,在做客 Sourcery 播客节目时,Affirm 首席执行官、PayPal 联合创始人马克斯 · 列夫琴(Max Levchin)指出, AI 编程工具正在快速拉高软件质量门槛,那些缺乏专有数据或增值服务的低质软件公司将首当其冲被淘汰。 IT之家援引 businessinsider 报道,列夫琴预判 AI 时代的软件行业格局,直言缺乏高质量软件的公司最容易受到 AI 编程冲击, 表示“淘汰糟糕软件早就该进行了”。 他强调,AI 时代软件质量的门槛正在快速提升, 那些界面简陋、功能单一且缺乏专有数据支撑的软件产品,将失去生存空间。 列夫琴进一步解释了“低质软件”的定义:这类产品往往体验不佳,却因承担某种重要功能而勉强存活。 企业过去常以“招聘工程师成本太高”为由拖延改进 ,但 AI 编程工具的出现让这一借口彻底失效。如果一家公司的软件既无专有数据加持,又无增值服务,被替代只是时间问题。 但这并不意味着所有软件公司都面临生存危机。Levchin 以 DoorDash 为例,驳斥“AI 能轻易复制平台型公司”的观点。 他认为,仅靠 AI 工具(如 OpenClaw)无法复刻 DoorDash 的核心壁垒,后者需要与无数餐厅谈判、安装专用终端、提取菜单数据并构建完整的线下运营网络。 列夫琴认为 DoorDash 的护城河不在于代码,而在于它整合了所有你喜爱的餐厅。 列夫琴指出,AI 可以生成代码, 却无法自动完成商业谈判与基础设施部署。 因此,拥有深厚线下运营积累和独特商业关系的公司,反而能在 AI 浪潮中保持安全。 Max Levchin 是可口可乐公司的董事,图源:可口可乐公司
workbuddy 的分析,看看质量: 1 个帖子 - 1 位参与者 阅读完整话题
半自动注册机,现在基本实现自动化,还有BUG在修,账号累计起来应该够我个人使用。是二开的codex-oauth-automation-extension-4.0.0,主要是修改了邮箱,使用的hotmail.com邮箱,还对部分页面的处置的优化,感觉这个也能降低弹手机号的概率。 只是使用简单的无痕浏览器运行的插件。一个hotmail.com邮箱可以使用5个别名邮箱成功注册,多了一般会报错。同一个IP短时间连续注册才会跳手机号,跳手机号可能和IP有关,具体没搞清楚。代码暂不开源,建议自己改。 想找一个便宜的渠道获得高质量的IP,最好不是拼车,50元/月以内,请推荐。 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 4 月 13 日消息,工业和信息化部办公厅发布关于做好 2026 年工业和信息化质量工作的通知。 通知提出,强化质量监督管理。协同开展中央质量、食品安全考核,配合做好产品国家质量监督抽查工作,开展锂电池、光伏组件、民用爆炸物品、无线电发射设备等重点产品质量检查,强化道路机动车辆产品生产一致性监督检查。引导电商平台开展网购产品质量自我声明,加大抽查力度,增强消费者质量辨别能力。发挥群众质量监督作用,倡导优质优价理念,切实保护消费者合法权益。 IT之家附通知全文如下: 工业和信息化部办公厅关于做好 2026 年工业和信息化质量工作的通知 工信厅科函〔2026〕147 号 各省、自治区、直辖市及计划单列市、新疆生产建设兵团工业和信息化主管部门,各省、自治区、直辖市及计划单列市通信管理局,部属有关单位,有关行业协会(联合会): 为贯彻落实中央经济工作会议精神和 2026 年《政府工作报告》部署,深入实施制造业卓越质量工程,体系化推进企业、产品、服务质量工作,加强质量技术创新,夯实质量技术基础,优化质量发展生态,促进一批企业质量管理能力升级,形成一批质量沿链传导行业样板,推动一批质量技术创新应用,培育一批质量公共服务载体,打造一批“中国制造”卓著品牌,为建设制造强国、质量强国、网络强国提供有力支撑。现就做好 2026 年工业和信息化质量工作通知如下: 一、重点任务 (一)实施企业质量提升行动 1.开展企业质量管理能力评价。引导和支持产品涉及人民群众切身利益特别是生命健康安全、与国家战略紧密相关并对区域和产业发展有较强引领作用、对产业链供应链质量联动提升带动性较强和具有较高市场占有率、较强发展潜力、较大质量提升空间的重点企业以及专精特新中小企业,开展质量管理能力评价,引导企业按照“经验级、检验级、保证级、预防级、卓越级”梯次路径,渐进式提升质量管理能力。进一步健全评价工作机制,有序扩大评估机构和评估人员队伍,完善质量管理能力配套标准。适时公布质量管理能力高等级企业名单,推动评价结果获得广泛采信。(部科技司、各地工业和信息化主管部门负责) 2.实施“质量沿链提升”计划。支持地方聚焦当地优势重点产业链,组织链主企业、龙头企业导入先进质量管理体系,明确全链条质量目标和实施路径,沿产业链传递质量要求,带动产业链上下游企业质量联动提升,打造一批产业链质量一致性管控样板。(部科技司、各地工业和信息化主管部门负责) (二)实施质量技术攀升行动 3.推动质量技术创新应用。探索采用“企业出题、政府搭台、能者解题”的“揭榜挂帅”攻关模式,凝练质量关键技术需求,研制高水平质量联合体培育遴选工作方案,支持地方组建高水平质量联合体,加快质量关键共性技术攻关,推动质量技术创新成果转化。开展质量技术创新应用典型经验推广,发挥引领带动作用。(部科技司、各地工业和信息化主管部门负责) 4.深化人工智能赋能质量提升。组织编制重点行业“人工智能 + 质量”应用全景图和转型路线图,明确各行业人工智能与质量融合的重点领域、实施步骤和预期目标等,为企业转型提供清晰指引。加快推动优质质量大模型、工业智能体等融合应用,提升质量管控的精准度和效率。(部科技司、各地工业和信息化主管部门负责) (三)实施产品和服务质量跃升行动 5.开展可靠性“筑基”和“倍增”工程。聚焦装备工业、电子信息行业,强化整机装备和复杂系统可靠性设计,攻关突破一批核心基础零部件,推动关键核心产品可靠性达到国际先进水平。聚焦重点领域编制《产品可靠性提升手册》,引导提升重点产品可靠性。挖掘一批具有带动效应的可靠性提升典型经验。(部科技司、装备一司、装备二司、电子司按职责分工负责) 6.分业施策推动制造业重点产品质量提升。推动重点行业开展重点产品质量分级标准研制,健全质量分级发布机制和采信机制。研制发布原材料产品、测试方法、技术规程等行业标准,推动提高重点材料领域强制性标准要求,推进绿色建材产品认证,促进原材料产品提质增效。加快建设高水平智能工厂,加强质量精准追溯、质量分析与改进等场景建设。强化重大技术装备攻关和系统集成创新。推动装备领域重点产品标准布局研究、制修订及应用,提升装备产品质量水平。深化数字化助力消费品“三品”行动,加快轻工产品和医药工业技术标准体系建设,加强食品、药品等领域质量监督、质量诚信与追溯体系建设,以需求为导向推出更多高性价比、满足适用性要求的产品,推动消费品质量从生产端符合型向消费端适配型转变。修订电器电子产品有害物质限制使用达标管理目录和限用物质应用例外清单。一体化推进电子信息制造业标准制订、标准宣贯、认证评估等能力建设,加大软件产品质量监督抽查力度,完善首版次软件应用激励政策,推动信息技术产品和服务质量升级。(部科技司、节能司、安全司、原材料司、装备一司、装备二司、消费品司、电子司、信发司按职责分工负责) 7.提高信息通信服务质量。推出 2026 年信息通信暖心服务十件实事,指导企业细化电信业务办理、客服保障能力、个人信息保护等措施,推动企业提升服务水平。压实企业主体责任,强化个人信息保护和电信网络诈骗治理,保护用户个人数据和财产安全。(部信管局、网安局、各地通信管理局负责) 8.提高通信建设工程质量。落实《通信建设工程质量提升和安全生产行动方案(2025—2027 年)》,持续提升通信建设工程质量,加强工程所需物资抽检工作,督促建设单位、施工单位严格进场材料设备质量管控,强化工程施工过程质量管理和验收管理,加强通信工程质量隐患排查。(部通信司、各地通信管理局负责) (四)夯实质量技术基础 9.强化标准引领。围绕传统产业转型升级完善相关标准,力争实现标准迭代与技术迭代同步,推动企业提升产品质量水平。以优势产业为重点统筹推进全产业链标准制定,不断巩固质量基础优势。深入实施新产业标准化领航工程,加强标准预研和应用,开展标准技术验证,为加快新产业高质量发展提供技术支撑。健全制造业可靠性标准体系,推动在重点产品强制性标准中增设可靠性指标,以高标准倒逼产品质量升级。(部科技司牵头、部内相关司局按职责分工负责) 10.加强计量保障。指导行业协会建强计量专业委员会。支持计量技术服务机构开展计量技术攻关、高端计量器具和标准物质研制、计量技术规范制修订,为企业提升精密测量水平提供一体化解决方案。加快突破一批检测装备,推动计量校准仪器仪表产业发展。(部科技司、装备一司按职责分工负责) 11.开展高端品质认证。鼓励专业机构加强认证技术和服务创新,支持在装备、电子等重点领域推进高端品质认证。加快质量认证数字化发展,强化先进数字技术应用,建立实施符合高质量发展需求的质量认证制度、评价规则和技术规范。(部科技司、装备一司、装备二司、电子司、信发司按职责分工负责) 12.提升质量公共服务效能。加强工业产品质量控制和技术评价实验室高水平建设,强化“一站式”综合性质量技术服务。鼓励地方将实验室布局建设纳入区域发展规划,引导实验室为区域产业发展提供质量公共服务。加快制造业中试平台布局建设,强化公共服务功能,支撑企业完善质量标准、控制和分析方法,验证工艺参数及过程,促进技术迭代、质量改进和产品升级。(部科技司牵头) (五)优化质量发展生态 13.支持开展群众性质量活动。支持行业协会、专业机构组织质量诊断、质量创新、用户体验、专业咨询等质量提升活动,常态化开展经验交流、成果展示、现场观摩以及先进质量标准贯标培训,挖掘一批具有带动效应的质量提升典型经验做法,弘扬卓越质量管理文化。(部科技司牵头,部内相关司局按职责分工负责) 14.提升质量人才素养。支持地方、行业协会、专业机构组织开展质量培训,鼓励部属高校、科研院所推进质量相关学科和课程建设,深化产教融合,培养高素质质量人才。支持建设可靠性实训基地,加强可靠性职业教育和技能培训,加快培养高层次可靠性人才。健全质量人才评价体系和激励机制,优化质量人才服务保障措施,壮大质量人才队伍。(部科技司牵头,部内相关司局按职责分工负责) 15.加强质量发展监测。健全制造业质量监测体系,加强质量发展形势研判跟踪,构建制造业卓越质量指数,建设工业质量大数据平台,开展分地区、分行业质量发展水平动态监测和分析应用,适时发布制造业质量发展报告。(部科技司牵头) 16.强化质量监督管理。协同开展中央质量、食品安全考核,配合做好产品国家质量监督抽查工作,开展锂电池、光伏组件、民用爆炸物品、无线电发射设备等重点产品质量检查,强化道路机动车辆产品生产一致性监督检查。引导电商平台开展网购产品质量自我声明,加大抽查力度,增强消费者质量辨别能力。发挥群众质量监督作用,倡导优质优价理念,切实保护消费者合法权益。(部内相关司局按职责分工负责) (六)实施“中国制造”品牌建设行动 17.提升企业品牌建设能力。将质量指标纳入品牌标准,健全制造业品牌标准体系,引导企业建立健全品牌培育管理体系,推动品牌建设与质量提升融合发展。支持行业协会、专业机构提供品牌创建评估、出海对接等服务,提高企业品牌建设能力和国际化运营能力。(部科技司牵头) 18.培育产业和区域品牌新优势。推动国家先进制造业集群提质升级,实施国家高新区新赛道培育行动,建设培育产业集群区域品牌。鼓励经典名企加快开发培育高附加值经典名品精品,加快推进中国消费名品方阵建设,培育纺织服装卓越品牌、地方特色食品产业,打造国际一流消费品品牌。(部规划司、科技司、消费品司按职责分工负责) 19.加强“中国制造”品牌培育推广。支持地方、行业协会、专业机构开展品牌建设沙龙、品牌故事展播、品牌场景展演等系列活动,加大品牌建设典型经验推广力度,宣传卓越质量观念,树立优质到优品的理念,营造品牌建设良好氛围,持续提升“中国制造”品牌知名度、美誉度和影响力。(部科技司牵头) 二、保障措施 各地工业和信息化主管部门、通信管理局要加强统筹协调,压实工作责任,细化年度安排,强化成效评估,加大政策激励,充分发挥各方作用,形成推进工业和信息化质量工作的强大合力。重要情况及时报工业和信息化部(科技司)。 工业和信息化部办公厅 2026 年 4 月 7 日
之前跑项目用的算力机,不知道为什么,访问 Cloudflare 托管的域名 ,基本都不通,报错一般是: TLS handshake timeout 这还不是最麻烦的,主要是 代理也连不上 。我问了 Codex,它那边判断大概是: 机房出口网络对 Cloudflare 的路径有限制,或者链路质量特别差 临时解决办法是: 通过 SSH 反向/转发 ,把我本机的代理转给这台算力机用。 能用是能用,但确实挺麻烦,维护起来也不方便。 想问问各位佬,这种情况有没有更好的解决办法? 1 个帖子 - 1 位参与者 阅读完整话题