Skip to main content
PROMPT SPACE
0

nvidia-ocr

by PromptSpace

تعرف ضوئي على الحروف عالي الدقة للصور والجداول والكتابة اليدوية باستخدام NVIDIA NeMo Retriever.

31 views

$12

One-time purchase

⚡ Skill ready to install in Claude Code, Gemini CLI, or any MCP-compatible client. Read the install guides →

Included in download

  • Downloadable skill package
  • Works with OpenClaw, Cursor
  • Instant install

About This Skill

ما الذي تفعله هذه المهارة

توفر هذه المهارة تعرفًا ضوئيًا على الحروف (OCR) عالي الأداء من خلال الاستفادة من واجهة برمجة تطبيقات NVIDIA NeMo Retriever. تتيح لوكيل الذكاء الاصطناعي الخاص بك "رؤية" النصوص واستخراجها من الصور والمستندات بدقة احترافية. تتعامل مع الهياكل المعقدة كالجداول والمخططات والإيصالات وحتى الكتابة اليدوية، وتُعيد نصًا منظمًا مع درجات الثقة وبيانات المربعات المحيطة.

لماذا تستخدم هذه المهارة

قد تعاني قدرات الرؤية المعتادة في نماذج اللغة الكبيرة أحيانًا من هلوسة النصوص أو الصعوبة في التعامل مع البيانات الكثيفة كالجداول أو لقطات الشاشة منخفضة الجودة. تستخدم هذه المهارة نموذج OCR متخصصًا ومُحسَّنًا للدقة العالية. تدعم المعالجة الدفعية لمجلدات بأكملها، وتوفر مقاييس الثقة لضمان موثوقية البيانات، وتحفظ المخرجات تلقائيًا في ملفات منظمة لمزيد من التحليل. وهي أسرع وأدق بشكل ملحوظ في مهام استخراج البيانات مقارنةً بالاستعلام العام عبر الرؤية.

الأدوات المدعومة

  • NVIDIA NeMo Retriever: نموذج OCR أساسي بأحدث تقنيات الذكاء الاصطناعي.
  • Python Integration: معالجة مدمجة لترميز Base64 ومعالجة الملفات دفعيًا.
  • Exporting: يحفظ النتائج محليًا بصيغتَي .txt أو .md لسهولة وصول المطورين.

Use Cases

  • استخراج البيانات الجدولية من لقطات الشاشة أو ملفات PDF إلى نص منظم.
  • رقمنة الملاحظات المكتوبة بخط اليد وحفظها بصيغة markdown قابلة للبحث.
  • المعالجة الدفعية لمجلد من الصور لاستخراج البيانات النصية وتجميعها.
  • التحقق من نتائج الاختبارات الآلية عن طريق استخراج النص من لقطات شاشة واجهة المستخدم.

Reviews

No reviews yet. Be the first to review this skill after you install it.

Security Scanned

Passed automated security review

Permissions

No special permissions declared or detected

OpenClaw, Cursor, Claude Code, Codex CLI

Creator

P

PromptSpace

We build AI agent skill packages for content creators. Specializing in Chinese social media automation.

Frequently Asked Questions

nvidia-ocr — AI Agent Skill | PromptSpace