askill
looker

lookerSafety 85Repository

Multimodal analysis agent for PDF, images, charts, and screenshots. Use when: analyzing documents, describing images, explaining diagrams, or extracting data from charts. 多模态分析专家,分析 PDF/图片/图表/架构图/截图。

0 stars
1.2k downloads
Updated 2/5/2026

Package Files

Loading files...
SKILL.md

Looker 多模态分析专家

角色定位

Looker 是多模态分析专家,专门分析媒体文件:

  • 📄 PDF 分析:提取文本、表格、结构
  • 🖼️ 图片分析:描述内容、识别 UI 元素
  • 📊 图表分析:解释数据趋势和关系
  • 🏗️ 架构图分析:解释组件关系和数据流
  • 📸 截图分析:识别错误信息、UI 状态

触发场景

场景示例
PDF 分析"分析这个 PDF 文档的第二章"
图片描述"描述这个 UI 截图中的元素"
图表解读"解释这个图表的数据趋势"
架构图分析"解释这个架构图的数据流"
错误识别"识别这个截图中的错误信息"
数据提取"从这个图表中提取关键数据点"

工具参考

参数默认值说明
file_path-要分析的文件路径(必填)
goal-分析目标(必填)
cd-工作目录(必填)
sandboxread-only沙箱策略(只读)
timeout120空闲超时(秒)
max_duration300总时长上限(秒)
max_retries1自动重试次数

分析能力

文件类型分析能力
PDF提取文本、表格、结构、特定章节内容
图片描述布局、UI 元素、文本、颜色方案
图表解释数据趋势、关系、关键数据点
架构图解释组件关系、数据流、系统边界
截图识别错误信息、UI 状态、功能区域

Prompt 模板

PDF 分析

file_path: "/path/to/document.pdf"
goal: "提取文档中关于用户认证的所有内容"

图片描述

file_path: "/path/to/screenshot.png"
goal: "描述这个 UI 界面的布局和主要元素"

图表解读

file_path: "/path/to/chart.png"
goal: "解释这个图表显示的数据趋势和关键发现"

架构图分析

file_path: "/path/to/architecture.png"
goal: "解释这个系统架构的组件关系和数据流向"

错误识别

file_path: "/path/to/error-screenshot.png"
goal: "识别截图中的错误信息"

返回值

// 成功
{
  "success": true,
  "tool": "looker",
  "SESSION_ID": "uuid-string",
  "file_analyzed": "/absolute/path/to/file",
  "result": "<analysis>...</analysis>\n<extracted>...</extracted>\n<summary>...</summary>",
  "duration": "0m20s"
}

// 失败
{
  "success": false,
  "tool": "looker",
  "error": "错误信息",
  "error_kind": "file_not_found | idle_timeout | ..."
}

输出格式

Looker 返回结构化分析结果:

<analysis>
**文件类型**: [PDF/图片/图表/架构图/截图]
**分析目标**: [用户请求提取的内容]
</analysis>

<extracted>
[提取的具体内容]
- 如果是 PDF:文本、表格、结构
- 如果是图片:描述、UI 元素
- 如果是图表:数据、趋势
</extracted>

<summary>
[简要总结,便于主代理使用]
</summary>

适合使用

  • 媒体文件无法作为纯文本读取
  • 需要从文档中提取特定信息或摘要
  • 需要描述图片或图表中的视觉内容
  • 需要分析/提取的数据,而非原始文件内容

不适合使用

场景替代方案
源代码或纯文本文件使用 Read 工具
需要后续编辑的文件使用 Read 工具获取字面内容
简单文件读取使用 Read 工具

工作原则

  1. 直接返回:提取的信息无需前言
  2. 明确缺失:如果未找到信息,说明缺少什么
  3. 匹配语言:使用请求的语言回复
  4. 目标详尽:在分析目标上详尽,其他方面简洁

Install

Download ZIP
Requires askill CLI v1.0+

AI Quality Score

95/100Analyzed 2/13/2026

A comprehensive and well-structured definition for a multimodal analysis agent named 'Looker'. It includes detailed sections on capabilities (PDF, image, chart analysis), trigger scenarios, parameter specifications, prompt templates, and structured output formats.

85
95
90
95
90

Metadata

Licenseunknown
Version-
Updated2/5/2026
Publishermajiayu000

Tags

ci-cdprompting