1 关于MyShell

2 新手指南

3 炉边对话

4 Shell Agent

5 常用问答

6 AI 开源社区周报

2.29 内容识别与分析 (Content Recognition & Analysis)

本类别的节点主要用于识别、分析和理解图像内容,包括物体检测、场景分析、特征提取等功能,通过这些节点可以获取图像的语义信息,为后续处理提供智能分析基础。

1. UltralyticsDetector(Ultralytics检测器)

中文名称:Ultralytics检测器

节点功能:使用Ultralytics模型(如YOLO系列)进行物体检测。

参数说明: - image:输入图像 - model_name:检测模型名称(如YOLOv8、YOLOv9等) - confidence_threshold:置信度阈值 - max_detections:最大检测数量 - device:运行设备 - annotations:是否在图像上标注检测结果 - class_filter:类别过滤器

输出端口: - DETECTION_IMAGE:标注了检测结果的图像 - DETECTIONS:检测结果数据 - BBOXES:边界框数据

使用案例: - 检测图像中的物体 - 为ControlNet提供边界框 - 创建智能裁剪和合成

优点: - 高精度的物体检测 - 支持多种YOLO模型 - 提供详细的检测信息 - 适合各种视觉分析任务

所属插件项目:ComfyUI-Impact-Pack(需额外安装)

最后更新日期:2025-04-15

2. CLIPVisionAnalyzer(CLIP视觉分析器)

中文名称:CLIP视觉分析器

节点功能:使用CLIP视觉模型分析图像内容和特征。

参数说明: - image:输入图像 - clip_vision_model:CLIP视觉模型 - extraction_layer:特征提取层 - extraction_method:特征提取方法 - normalize_features:是否归一化特征 - return_top_k:返回前K个特征

输出端口: - FEATURES:提取的特征 - SIMILARITY_SCORES:相似度分数 - DESCRIPTION:生成的图像描述

使用案例: - 分析图像内容 - 提取图像特征用于匹配 - 生成图像描述

优点: - 提供深度图像理解 - 可以提取多层次特征 - 支持图像内容分析 - 适合图像理解和匹配任务

所属插件项目:ComfyUI-CLIPVision-Explorer(需额外安装)

最后更新日期:2025-04-05

3. FaceDetector(人脸检测器)

中文名称:人脸检测器

节点功能:检测图像中的人脸并提取相关信息。

参数说明: - image:输入图像 - detection_model:人脸检测模型 - confidence_threshold:置信度阈值 - extract_features:是否提取面部特征 - extract_landmarks:是否提取面部关键点 - align_faces:是否对齐人脸 - max_faces:最大检测人脸数

输出端口: - DETECTION_IMAGE:标注了人脸的图像 - FACES:检测到的人脸图像列表 - FACE_DATA:人脸数据(位置、特征等) - LANDMARKS:面部关键点数据

使用案例: - 人脸检测和分析 - 面部特征提取 - 人脸对齐和处理

优点: - 高精度人脸检测 - 提供丰富的面部信息 - 支持多人脸处理 - 适合人像处理和分析

所属插件项目:ComfyUI-FaceAnalysis(需额外安装)

最后更新日期:2025-03-25

4. ImageClassifier(图像分类器)

中文名称:图像分类器

节点功能:对图像内容进行分类,识别图像所属类别。

参数说明: - image:输入图像 - classifier_model:分类模型 - top_k:返回前K个分类结果 - threshold:分类阈值 - normalize_scores:是否归一化分数 - return_features:是否返回特征

输出端口: - CLASSIFICATIONS:分类结果 - SCORES:分类分数 - FEATURES:图像特征(如果启用)

使用案例: - 图像内容分类 - 场景识别 - 内容过滤和组织

优点: - 支持多种分类模型 - 提供分类置信度 - 可以返回特征表示 - 适合内容分类和筛选

所属插件项目:ComfyUI-ClassificationToolset(需额外安装)

最后更新日期:2025-03-20

5. OCRExtractor(光学字符识别提取器)

中文名称:光学字符识别提取器

节点功能:从图像中提取和识别文本内容。

参数说明: - image:输入图像 - ocr_engine:OCR引擎选择 - language:识别语言 - detect_orientation:是否检测文本方向 - min_confidence:最小置信度 - highlight_text:是否高亮显示文本

输出端口: - TEXT:识别的文本内容 - TEXT_REGIONS:文本区域信息 - ANNOTATED_IMAGE:标注了文本的图像

使用案例: - 从图像中提取文本 - 文档分析和处理 - 图像中文本的翻译和处理

优点: - 支持多种语言文本识别 - 提供文本位置信息 - 可以处理复杂布局 - 适合文档和图像文本处理

所属插件项目:ComfyUI-TextExtraction(需额外安装)

最后更新日期:2025-04-10

6. SceneUnderstanding(场景理解)

中文名称:场景理解

节点功能:分析图像场景结构和内容关系。

参数说明: - image:输入图像 - understanding_model:场景理解模型 - detail_level:理解详细程度 - extract_relationships:是否提取关系 - extract_attributes:是否提取属性 - spatial_analysis:是否进行空间分析

输出端口: - SCENE_GRAPH:场景图数据 - OBJECTS:检测到的对象 - RELATIONSHIPS:对象间关系 - SCENE_DESCRIPTION:场景描述

使用案例: - 复杂场景分析 - 图像内容关系理解 - 智能图像描述生成

优点: - 提供深度场景理解 - 分析对象间关系 - 生成结构化场景表示 - 适合高级图像理解任务

所属插件项目:ComfyUI-SceneAnalysis(需额外安装)

最后更新日期:2025-04-01

7. ImageSimilarityAnalyzer(图像相似度分析器)

中文名称:图像相似度分析器

节点功能:分析和比较多个图像之间的相似度。

参数说明: - images:输入图像列表 - reference_image:参考图像 - similarity_metric:相似度度量方法 - feature_extractor:特征提取器 - threshold:相似度阈值 - return_rankings:是否返回排名

输出端口: - SIMILARITY_SCORES:相似度分数 - RANKINGS:相似度排名 - MOST_SIMILAR:最相似的图像 - FEATURES:提取的特征

使用案例: - 图像相似度比较 - 重复图像检测 - 图像检索和匹配

优点: - 支持多种相似度度量 - 可以批量比较图像 - 提供排名和分数 - 适合图像比较和检索

所属插件项目:ComfyUI-ImageComparison(需额外安装)

最后更新日期:2025-03-15

8. EmotionAnalyzer(情绪分析器)

中文名称:情绪分析器

节点功能:分析图像中人物的情绪状态。

参数说明: - image:输入图像 - emotion_model:情绪分析模型 - detect_faces:是否先检测人脸 - top_k:返回前K个情绪结果 - threshold:情绪识别阈值 - visualize:是否可视化结果

输出端口: - EMOTIONS:检测到的情绪 - SCORES:情绪置信度分数 - ANNOTATED_IMAGE:标注了情绪的图像

使用案例: - 人物情绪分析 - 表情识别 - 情感响应生成

优点: - 识别多种情绪状态 - 提供情绪置信度 - 可以处理多人场景 - 适合情感分析和交互

所属插件项目:ComfyUI-EmotionRecognition(需额外安装)

最后更新日期:2025-03-30

9. ContentModerator(内容审核器)

中文名称:内容审核器

节点功能:审核和过滤图像内容,检测不适当或敏感内容。

参数说明: - image:输入图像 - moderation_model:审核模型 - categories:审核类别 - threshold:审核阈值 - action_on_detection:检测到时的操作 - blur_sensitive:是否模糊敏感内容

输出端口: - MODERATION_RESULT:审核结果 - SAFE_SCORE:安全分数 - FILTERED_IMAGE:过滤后的图像 - CATEGORIES_SCORES:各类别分数

使用案例: - 内容安全过滤 - 敏感内容检测 - 自动内容审核

优点: - 支持多种内容审核类别 - 提供详细的分类分数 - 可以自动处理敏感内容 - 适合内容安全管理

所属插件项目:ComfyUI-ContentSafety(需额外安装)

最后更新日期:2025-04-05

10. FeatureExtractor(特征提取器)

中文名称:特征提取器

节点功能:从图像中提取各种视觉特征。

参数说明: - image:输入图像 - extractor_type:特征提取器类型 - feature_level:特征级别 - spatial_pooling:空间池化方法 - normalize:是否归一化特征 - dimensionality_reduction:维度降低方法

输出端口: - FEATURES:提取的特征 - FEATURE_MAP:特征图 - FEATURE_VISUALIZATION:特征可视化

使用案例: - 图像特征提取 - 视觉表示学习 - 图像检索和匹配

优点: - 支持多种特征提取方法 - 提供多层次特征 - 可以进行特征可视化 - 适合高级视觉分析任务

所属插件项目:ComfyUI-FeatureExtraction(需额外安装)

最后更新日期:2025-03-20