ChatGPT 的图像输入-常见问题解答-教程-AI论坛

openai

发布于 10月前 1349 0

什么是图像输入以及它们在 ChatGPT 中如何工作？

ChatGPT 现在具有图像功能，可以理解和解释您作为图像输入添加到对话中的图像。

我应该如何在对话中使用图像输入？

基本用途：上传照片即可开始。询问图像中的对象、分析文档或探索视觉内容。在稍后的回合中添加更多图像以加深或转移讨论。随时带着新照片回来。

注释图像：要引起对特定区域的注意，请考虑在上传之前在图像上使用照片编辑标记工具。这会引导 ChatGPT 专注于您认为重要的元素。

哪些计划可以使用图像输入？

Plus 和 ChatGPT Enterprise。尚未在英国和欧盟上市。

哪些型号可以接受图像输入？

GPT-4。

哪些平台可以输入图像？

所有平台，包括网络（chat.openai.com）和移动（iOS / Android）。

我的图像是否用于改进您的模型？

对于每种产品，我们使用内容（包括图像）的方法都是相同的。

请参阅如何使用您的数据来提高模型性能，以更好地了解如何使用 ChatGPT 上的内容来提高模型性能以及用户拥有的选择。

对于ChatGPT Enterprise，我们不使用内容来训练我们的模型。

如何在 ChatGPT 中添加图像输入？

确保模型选择器设置为 GPT-4，然后点击提示区域中的 + 图标以添加图像输入。

图像输入支持视频吗？

不，它不能处理视频。目前仅支持处理静态图像。

支持哪些文件类型？

PNG (.png)、JPEG（.jpeg 和 .jpg）和非动画GIF (.gif)。

我可以一次上传多少张图片？

您可以添加到对话中的图像数量取决于多种因素，包括图像的大小和伴随图像的文本量。作为一般准则，如果遇到问题，请考虑减少图像数量或大小。

每张图片的大小限制是多少？

20MB。

图像功能如何处理模糊或不清楚的图像？

如果图像不明确或不清楚，模型将尽力解释它。然而，结果可能不太准确。

用户在使用 ChatGPT 和图像输入时应注意哪些限制？

如果您使用 ChatGPT 的新图像输入功能，请务必注意以下限制：

医疗：该模型不适合解释 CT 扫描等专业医学图像，也不应用于提供医疗建议。

非英语：该模型在处理包含非拉丁字母文本（例如日语或韩语）的图像时表现不佳。

大文本：放大图像中的文本以提高可读性，但避免裁剪重要细节。

旋转：模型可能会误解旋转/颠倒的文本或图像。

视觉元素：模型可能难以理解颜色或样式（如实线、虚线或点线）变化的图形或文本。

空间：该模型难以处理需要精确空间定位的任务，例如识别国际象棋位置。

准确性：在某些情况下，模型可能会生成不正确的描述或标题。

形状：模型难以处理全景和鱼眼图像。

元数据和调整大小：模型不处理原始文件名或元数据，图像在分析之前会调整大小，从而影响其原始尺寸。

计数：可以给出图像中对象的近似计数。

AD：GPT-4官方账号：点击购买

联系反馈邮箱：ruiwang076@gmail.com

请先登录后发表评论！

登录注册

最新回复 (0)

暂无评论