IvesFeng

蓝衫科技联合创始人，ShirtAI创始人

文章70 网址668 书籍8 软件22 评论1

已发布70

Gemini = PPT生产力之神？亲测20页报告秒出片！

Gemini是谷歌推出的AI助手，能高效生成逻辑清晰、图文并茂的PPT。用户只需输入指令并提供资料，Gemini即可在几分钟内完成20页左右的专业演示文稿，支持自动提炼要点、智能排版、数据可视化与配图...

3个月前

05490

ChatGPT Atlas：AI浏览器的革新之作

OpenAI发布首款AI原生浏览器ChatGPT Atlas，深度融合ChatGPT智能能力。其核心功能包括：实时AI辅助网页内容总结与互动、智能写作优化、自然语言控制浏览器操作、个性化记忆推荐、智能...

Uncategorized

3个月前

03500

Veo3.1与Sora2：谁才是视频生成的真正王者？

谷歌的Veo3.1与OpenAI的Sora2在AI视频生成领域展开竞争。Veo3.1以精准控制、高质量音画同步见长，适合专业长视频创作。Sora2则胜在流畅自然的动态效果和娱乐性，更适合创意短视频。两...

Uncategorized

3个月前

04840

谷歌Gemini 3.0：突破性的网页版操作系统生成

谷歌Gemini 3.0 Pro凭借强大生成能力，可基于简单提示词在单一HTML文件中生成功能完整的网页版macOS、Windows及Linux操作系统界面，实现流畅交互体验。尽管其在界面复刻与功能仿...

Uncategorized

3个月前

02770

谷歌Gemini 3.0：突破性的网页版操作系统生成

Uncategorized

3个月前

04110

OmniAvatar：让静态照片活起来的AI数字人技术突破

OmniAvatar是浙江大学和阿里巴巴集团联合开发的音频驱动数字人系统，能够根据静态照片、音频及文本提示生成自然流畅的全身动态视频。相比传统“说话头像”技术，该系统在身体动作协调、高精度音视频同步和...

Uncategorized

7个月前

07460

OmniGen2：新一代多模态AI的突破性进展

OmniGen2是一款基于Qwen-VL-2.5架构的多模态生成模型，拥有70亿参数，其中30亿用于文本处理，40亿用于图像扩散生成。其核心能力包括智能文本转图像、上下文感知编辑和多模态理解。新增的自...

Uncategorized

7个月前

05980

GPT-5来了！OpenAI下一代超级模型的全方位解析

GPT-5将集成Codex、Operator等多个AI工具，实现编程、研究、操作与记忆功能一体化。具备完全多模态能力，可处理语音、图像、代码与视频输入，并能智能切换推理与对话模式。据测试，其编程效率可...

Uncategorized

7个月前

05290

六大主流AI Agent深度评测：探索产品价值与发展方向

文章对Manus、扣子空间、Lovart、Flowith Neo、Skywork和超级麦吉六款主流AI Agent产品进行了评测，从执行能力、可信度和使用频次三个维度分析其市场竞争力。Lovart、S...

Uncategorized

8个月前

08360

程序员的提示工程实战手册

提示工程的核心原则在与AI代码助手协作时，有效的沟通策略至关重要。想象你正在指导一位技术能力很强但对你项目背景一无所知的同事，你需要提供足够的信息让他理解并解决问题。关键原则提供充分的上下文信息...

提示词工程

8个月前

05060

加载更多