清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026
很多人在使用文生图工具时都会遇到类似的情况,输入一段很清晰的描述,希望画面中人物站在左边、动物在右边,或者希望海报上出现一段完整可读的文字,但生成结果却常常让人失望。要么位置关系混乱,要么文字变形,要么整体画面看起来不自然。继续调整参数,有时结果会更接近描述,但画面质量却明显下降,颜色变得奇怪,结构开始扭曲。反复尝试之后,往往需要生成十几张甚至几十张图,才能勉强挑出一张可用的。这种既想让模型听懂指...
人工智能前沿资讯
很多人在使用文生图工具时都会遇到类似的情况,输入一段很清晰的描述,希望画面中人物站在左边、动物在右边,或者希望海报上出现一段完整可读的文字,但生成结果却常常让人失望。要么位置关系混乱,要么文字变形,要么整体画面看起来不自然。继续调整参数,有时结果会更接近描述,但画面质量却明显下降,颜色变得奇怪,结构开始扭曲。反复尝试之后,往往需要生成十几张甚至几十张图,才能勉强挑出一张可用的。这种既想让模型听懂指...
你可能遇到过这样一种情况,一个模型原本只做一件事的时候表现很好,但一旦不断往里面加新任务,它反而开始变差了。不是彻底失效,而是变得不稳定,有些能力开始下降,有些结果开始波动。问题不在于模型不会,而在于它原本会的东西,被后来加入的任务“挤掉了一部分”。这背后其实有一个很少被说清楚的问题。模型的能力并不是一块一块独立放进去的,而是共享同一套内部表示空间。简单理解,就是所有任务都在“用同一块地方存信息”...
IT之家 4 月 22 日消息,据日本共同社报道,相关人士当地时间 4 月 21 日透露,关于去年发射失败后一直暂停运用的 H3 火箭,日本宇宙航空研究开发机构(JAXA)正在探讨今年 6 月 10 日恢复发射。2025 年 12 月 22 日,日本宇宙航空研究开发机构发射一枚 H3 火箭,火箭在飞行途中第二级发动机燃烧提前停止,火箭上搭载的卫星未能进入预定轨道。IT之家注意到,此次发射任务最初定...
过去一段时间,AI 视频最让人惊艳的,往往都是前几秒。人物状态自然,光影氛围到位,动作也足够流畅,很容易让人产生一种感觉,视频生成已经离真正可用不远了。但行业越往前走,问题也越清楚,真正难的从来不是做出一小段漂亮画面,而是能不能把这种质量稳定地延续下去。一旦视频时长被拉长,很多模型就会开始慢慢失稳,人物、场景和动作表面上还在延续,内部却已经出现细节漂移和时序松动。这也是为什么,今天 AI 视频行业...
IT之家 4 月 22 日消息,谷歌昨日(4 月 21 日)发布博文,宣布升级其自主研究智能体,推出 Deep Research 与 Deep Research Max,均基于 Gemini 3.1 Pro 模型打造,让智能体从复杂的摘要引擎转变为企业级工作流的基础组件。IT之家援引博文介绍,Deep Research 智能体适用于交互式用户场景,平衡优化速度和效率;而 Deep Research...
IT之家 4 月 22 日消息,别克高端新能源品牌“至境”旗下首款 SUV —— 别克至境 E7 今日正式上市,官方指导价 15.99 万元起。该车可享 5000 元置换补贴,上汽通用三品牌可享 7000 元置换补贴,上市权益价 15.49 万元起。别克至境 E7 提供三款配置,分别为 1600 大满配、1600 超满配和 1600 超满配 Turbo 版。外观方面,至境 E7 延续了至境 SUV...
过去两年,视频生成的发展几乎是指数级的。从最早只能生成模糊片段,到如今可以生成具有叙事结构、光影一致性甚至风格控制的长视频,行业表面上已经接近一个阶段性成熟。但如果把评价标准从“能不能生成一段视频”稍微提高到“能不能控制镜头”,问题就会完全暴露出来。当前大多数模型仍然停留在一种近似二维的生成范式中,它们擅长在时间上延续视觉模式,却缺乏对空间结构的稳定建模能力。一旦涉及视角变化,模型往往无法保证同一...
新用户送 6 刀,每 10 楼抽 1 张 100 刀日卡 网站地址 https://aihub2api.com/ AIHbu2API 每个人自己的中转站,如果你手里有多个海外订阅,又不想自己买海外服务器、自己买海外 IP 代理、自己搭中转站,可以试试这个平台。 平台目前也提供 OpenAI 模型能力:支持 gpt-5.2 ; gpt-5.4 ; gpt-5.3-codex ; gpt-5.4-mi
2026年4月19日,第二届北京亦庄人形机器人半程马拉松赛事圆满落幕。多台搭载进迭时空 RISC-V AI CPU K3 芯片的「灵龙 2.0」人形机器人顺利完赛。「灵龙 2.0」是上海国家地方共建人形机器人创新中心开发的人形机器人平台。在长距离、高负载、强实时的极限场景中,K3 经受住了实战验证。面对人形机器人运动控制对芯片“算力、响应、功耗、通信”高度耦合的系统级严苛要求:既要保障A...
我们正在寻找一位对生成式 AI ( GenAI )充满热情,且功底扎实的 Java 工程师加入我们的团队。您将负责构建基于大语言模型( LLM )的企业级应用,利用 Java 强大的生态系统(如 Spring Boot, LangChain4j, Spring AI )连接业务逻辑与 AI 能力。您不仅仅是编写 API ,更是 AI 落地“最后一公里”的关键执行者。 岗位职责 (Responsib
IT之家 4 月 22 日消息,OpenAI 今天(4 月 22 日)发布 ChatGPT Images 2.0 生图工具外,其偷跑的 GPT-5.5 模型迅速成为网友热议焦点。根据部分网友反馈,在 Codex CLI 终端界面,意外出现了 GPT-5.5 模型,显示为“最前沿的智能体编程模型”。根据网友 DavidAGMM 在 Reddit 社区发帖内容,Codex CLI 终端界面出现了一大堆...
4 月 21 日,SpaceX 宣布与 AI 编程工具 Cursor 达成协议:以 100 亿美元换取一个期权,可在今年晚些时候以 600 亿美元正式收购 Cursor ;如果不行权,这 100 亿美元也将转为双方的合作费用。 严格来说,这不是一次「直接收购」,而是一个期权交易: SpaceX 支付 100 亿美元,获得一个「选项」 今年晚些时候,可以选择以 600 亿美元正式收购 Cursor
IT之家 4 月 22 日消息,据英国《金融时报》援引知情人士消息报道,人工智能公司 OpenAI 拟向与多家私募股权公司成立的新合资企业注资至多 15 亿美元(IT之家注:现汇率约合 102.55 亿元人民币)。报道称,这家 ChatGPT 开发商将先向这家内部名为 DeployCo 的合资企业投入 5 亿美元股权,该企业预计在 5 月初完成的一轮融资中估值达到 100 亿美元。报道称,Depl...
IT之家 4 月 22 日消息,东方电缆今日发布 2026 年一季度报告:营业总收入: 28.83 亿元,同比增长 34.28%归母净利润: 3.72 亿元,同比增长 32.26%扣非净利润: 3.69 亿元,同比增长 34.61%经营现金流:- 9.73 亿元基本每股收益: 0.54 元 / 股,同比增长 31.71%稀释每股收益: 0.54 元 / 股,同比增长 31.71%加权平均净资产收益...
[内推直招] [ AI 创业机会] 招聘有梦想的大数据开发工程师啦 薪资:10K-20K (以能定薪+年终奖+股权) 职位描述 雷军最早加入金山,就是从程序员干起。 后来开始做项目,搞研发,带团队,靠着坚持和实干,一路晋升做到金山 CEO ,最终带领公司成功上市。 互联网浪潮之下,雷军抓住机遇,创立小米,一步步把小米做成国民级大品牌! 雷军从普通工程师逆袭成顶级创业者,靠的就是踏实、韧劲和长