IvesFeng

蓝衫科技联合创始人,ShirtAI创始人
Gemini = PPT生产力之神?亲测20页报告秒出片!

Gemini = PPT生产力之神?亲测20页报告秒出片!

Gemini是谷歌推出的AI助手,能高效生成逻辑清晰、图文并茂的PPT。用户只需输入指令并提供资料,Gemini即可在几分钟内完成20页左右的专业演示文稿,支持自动提炼要点、智能排版、数据可视化与配图...
1个月前
02280
ChatGPT Atlas:AI浏览器的革新之作

ChatGPT Atlas:AI浏览器的革新之作

OpenAI发布首款AI原生浏览器ChatGPT Atlas,深度融合ChatGPT智能能力。其核心功能包括:实时AI辅助网页内容总结与互动、智能写作优化、自然语言控制浏览器操作、个性化记忆推荐、智能...
2个月前
02470
Veo3.1与Sora2:谁才是视频生成的真正王者?

Veo3.1与Sora2:谁才是视频生成的真正王者?

谷歌的Veo3.1与OpenAI的Sora2在AI视频生成领域展开竞争。Veo3.1以精准控制、高质量音画同步见长,适合专业长视频创作。Sora2则胜在流畅自然的动态效果和娱乐性,更适合创意短视频。两...
2个月前
02490
谷歌Gemini 3.0:突破性的网页版操作系统生成

谷歌Gemini 3.0:突破性的网页版操作系统生成

谷歌Gemini 3.0 Pro凭借强大生成能力,可基于简单提示词在单一HTML文件中生成功能完整的网页版macOS、Windows及Linux操作系统界面,实现流畅交互体验。尽管其在界面复刻与功能仿...
2个月前
01920
谷歌Gemini 3.0:突破性的网页版操作系统生成

谷歌Gemini 3.0:突破性的网页版操作系统生成

谷歌Gemini 3.0 Pro凭借强大生成能力,可基于简单提示词在单一HTML文件中生成功能完整的网页版macOS、Windows及Linux操作系统界面,实现流畅交互体验。尽管其在界面复刻与功能仿...
2个月前
02220
OmniAvatar:让静态照片活起来的AI数字人技术突破

OmniAvatar:让静态照片活起来的AI数字人技术突破

OmniAvatar是浙江大学和阿里巴巴集团联合开发的音频驱动数字人系统,能够根据静态照片、音频及文本提示生成自然流畅的全身动态视频。相比传统“说话头像”技术,该系统在身体动作协调、高精度音视频同步和...
5个月前
05190
OmniGen2:新一代多模态AI的突破性进展

OmniGen2:新一代多模态AI的突破性进展

OmniGen2是一款基于Qwen-VL-2.5架构的多模态生成模型,拥有70亿参数,其中30亿用于文本处理,40亿用于图像扩散生成。其核心能力包括智能文本转图像、上下文感知编辑和多模态理解。新增的自...
5个月前
05150
GPT-5来了!OpenAI下一代超级模型的全方位解析

GPT-5来了!OpenAI下一代超级模型的全方位解析

GPT-5将集成Codex、Operator等多个AI工具,实现编程、研究、操作与记忆功能一体化。具备完全多模态能力,可处理语音、图像、代码与视频输入,并能智能切换推理与对话模式。据测试,其编程效率可...
5个月前
04560
六大主流AI Agent深度评测:探索产品价值与发展方向

六大主流AI Agent深度评测:探索产品价值与发展方向

文章对Manus、扣子空间、Lovart、Flowith Neo、Skywork和超级麦吉六款主流AI Agent产品进行了评测,从执行能力、可信度和使用频次三个维度分析其市场竞争力。Lovart、S...
6个月前
07470
程序员的提示工程实战手册

程序员的提示工程实战手册

提示工程的核心原则 在与AI代码助手协作时,有效的沟通策略至关重要。想象你正在指导一位技术能力很强但对你项目背景一无所知的同事,你需要提供足够的信息让他理解并解决问题。 关键原则 提供充分的上下文信息...
6个月前
04270