MoeCopy AI LogoMoeCopy AI

功能特性

MoeCopy AI 的核心功能介绍

功能概览

example example-3

弹窗模式 (Popup)

  • 一键解析: 点击插件图标或浮动按钮,快速解析当前网页内容
  • 实时编辑: 支持手动编辑提取的内容
  • 内容预览: 编辑时可实时预览效果,Markdown 支持全屏预览
  • 智能识别: 自动识别文章主体、标题、作者和发布日期
  • 多种抓取模式:
    • 选择器模式: 使用 CSS 选择器精确提取,适合结构化网站
    • Readability 模式: 基于 Mozilla Firefox 阅读模式算法,智能识别文章内容
    • 混合模式: 自动选择最佳结果(推荐)
  • 双版本输出:
    • 原始格式版: 保留 Markdown 格式和原始换行
    • 紧凑版: 清理多余空格换行,优化 AI 模型输入
  • 高质量 Markdown 转换: v0.2.1 基于 unified/rehype/remark 解析框架,输出更规范一致
  • 智能清理: 自动去除干扰元素和无意义内容
  • 字数与 Token 统计: 显示实际字数和估算的 AI 模型 token 数量,使用 gpt-tokenizer 分词展示
  • 移动端适配: 响应式设计,支持移动设备
  • 图片提取: 从文章中提取所有图片及元信息
  • 页面元数据: 自动提取 og:title、og:description 等元标签,以表格形式展示
  • 自定义选择器: 允许用户自定义 CSS 选择器规则
  • AI 内容摘要:
    • 通过 {{content}} 等变量组合抓取内容与 AI 对话
    • 支持自定义摘要提示词
    • 自动保存摘要历史记录
  • 数据导出: 支持导出为 JSON 格式

侧边栏模式 (Side Panel)

v0.2.0 新增

全新侧边栏界面,无需离开当前页面即可完成操作。

批量抓取

一次性抓取多个链接中的文档内容。

  • 可视化元素选择器: 在页面上直接点击选择包含链接的区域
  • 智能链接提取: 自动识别选中区域内所有链接并预览
  • 链接管理: 手动添加、编辑、删除;同域名过滤;批量选择
  • 正则过滤: 使用正则表达式筛选链接
    • 匹配目标:URL / 文本 / 两者
    • 过滤模式:排除匹配项 / 仅保留匹配项
    • 8 个内置预设规则:
      预设说明
      排除图片链接过滤 jpg、png、gif、webp 等
      排除锚点链接过滤页内 # 锚点
      排除分页链接过滤 ?page= 等分页链接
      排除登录/注册过滤 login、signup 等
      排除静态资源过滤 css、js、字体文件
      排除媒体链接过滤 mp4、mp3 等
      仅保留文档链接只保留 pdf、doc、md 等
      仅保留网页链接只保留 html、php 等
  • 分页抓取: 支持选择"下一页"按钮,自动翻页收集链接
  • 三种抓取策略:
    策略描述特点
    Fetch API直接获取 HTML速度快,无法处理 JS 渲染页面
    后台标签页后台加载页面支持 JS 渲染,保留登录态
    当前标签页当前页面依次访问用户可见过程,适合监控
  • 实时进度: 显示抓取进度,支持暂停/继续/取消
  • 结果导出:
    • 单独复制某文档的 Markdown 内容
    • ZIP 打包导出: 包含 index.md 索引文件和 docs/ 文档文件夹

单页抓取

v0.2.1 新增

原悬浮球功能整合至此,提供更便捷的单页内容提取体验。

  • 快速抓取: 一键提取当前页面内容
  • AI 总结按钮: 快速生成内容摘要,无需切换到弹窗
  • 多格式输出: HTML / Markdown / 纯文本
  • 一键复制: 快速复制到剪贴板

内容提取

选择页面任意元素,快速提取为多种格式。

  • 可视化选择器: 鼠标悬停高亮,点击选中
  • 多格式输出: HTML / Markdown / 纯文本
  • 一键复制: 快速复制到剪贴板
  • AI 总结: v0.2.1 新增 AI 总结按钮,可直接对提取内容生成摘要

配置选项

  • 抓取模式: 选择器模式、Readability 模式或混合模式
  • 抓取时机: 页面加载后自动抓取或手动触发(默认手动)
  • 调试面板: 可配置是否显示
  • 日志级别: 从跟踪到静默多个级别
  • AI 提供商设置: 基于 xsAI 配置 API 密钥、模型选择、系统提示词

待实现功能

AI 增强

  • 图片 OCR 功能,提取图片中的文本

更多自定义

  • 为特定网站创建抓取模板
  • 导入/导出选择器配置
  • 常用网站预设配置库

功能优化

  • 关键信息提取和重点标记
  • 结构化数据导出(JSON、Markdown 等)
  • 数据清洗和格式转换工具
Edit on GitHub

Last updated on

On this page