UiPath Document Understanding with NER

ในโลกปัจจุบัน องค์กรต่างๆ การใช้งานเอกสารต่างๆ มากมายทุกวัน การประมวลผลเอกสารได้รับความสนใจอย่างมากในโลกของระบบอัตโนมัติ เนื่องจากเป็นงานที่ซ้ำซากจำเจซึ่งต้องใช้เวลาและความพยายามอย่างมาก เอกสารมีรูปแบบต่างกัน : แบบที่มีโครงสร้าง กึ่งมีโครงสร้าง และไม่มีโครงสร้าง การใช้เทมเพลตเพื่อดึงข้อมูลจากเอกสารที่มีโครงสร้างนั้นทำได้ง่าย เนื่องจากเป็นไปตามโครงสร้างเดียวกันในเอกสารทั้งหมด เทคโนโลยีในปัจจุบันช่วยให้เราใช้โมเดลการเรียนรู้ของเครื่องต่างๆ เพื่อดึงข้อมูลจากเอกสารกึ่งโครงสร้าง เช่น ใบแจ้งหนี้ ใบสั่งซื้อ ฯลฯ อย่างไรก็ตาม การดึงข้อมูลจากเอกสารที่ไม่มีโครงสร้างอาจทำได้ยากเล็กน้อยเนื่องจากเอกสารไม่เป็นไปตามรูปแบบ ในบทความนี้ คุณจะค้นพบวิธีที่ UiPath ตั้งชื่อโมเดลการรับรู้เอนทิตีทำให้ผู้ใช้สามารถดึงข้อมูลเอนทิตีจากเอกสารที่ไม่มีโครงสร้างได้ สิ่งที่ต้องเตรียม ความเข้าใจ UiPath Document Understanding Framework เข้าใจภาพรวมของ UiPath AI Center™ และการใช้งาน เตรียมระบบพร้อมใช้งาน (การทดลองใช้แพลตฟอร์มคลาวด์ที่สร้างขึ้นใหม่ หรือ แพลตฟอร์ของมองค์กร) การจำลองสถานการณ์ ลองพิจารณาสถานการณ์ง่ายๆ ที่เราจำเป็นต้องดึงข้อมูลบางอย่างจากสัญญาทางกฎหมาย ดังที่เราทราบ สัญญาทางกฎหมายนั้นไม่มีโครงสร้างและไม่เป็นไปตามรูปแบบใดรูปแบบหนึ่ง ดังนั้น ข้อมูลที่มีอยู่ในเอกสารทางกฎหมายฉบับหนึ่งอาจไม่อยู่ในเอกสารทางกฎหมายอื่น หรืออาจมีอยู่ในรูปแบบอื่น ในสถานการณ์สมมติของเราที่นี่ เราจะดูที่ข้อมูลเป็นหลัก เช่น ชื่อบริษัท ชื่อพนักงาน ชื่อผู้ขาย และวันที่มีผลในเอกสาร ต่อไปนี้คือตัวอย่างเอกสารทางกฎหมายบางส่วนที่เราวางแผนจะใช้สำหรับกรณีการใช้งานนี้ การจับข้อมูลชื่อนิติบุคคล การรู้จำชื่อเอนทิตีเป็นกระบวนการในการระบุและแยกหน่วยข้อมูล เช่น ชื่อ ของบุคคล องค์กร ค่าตัวเลข ข้อมูลวันที่และเวลา ตำแหน่งทางภูมิศาสตร์ เป็นต้น แบบจำลองที่ใช้สำหรับ NER สามารถระบุข้อมูลดังกล่าวจากสตริงที่กำหนดและจัดหมวดหมู่ตาม ประเภทของมัน UiPath

UiPath 2022.3 Monthly Update

UiPath Document Understanding UiPath Document Understanding ได้มีการอัพเดทการอ่านลายเซนต์แบบมีประสิทธิภาพมากขึ้น Document OCR ของเราในระบบคลาวด์ได้รับการปรับให้เหมาะสมเพื่อจดจำลายมือเขียนและลายเซ็น รวมทั้งทำงานได้ดีขึ้นสำหรับข้อความที่พิมพ์และช่องทำเครื่องหมาย ขณะนี้ Document OCR สามารถประมวลผลลายมือและลายเซ็นได้ เราขอแนะนำให้คุณใช้ Form Extractor และ Document OCR สำหรับเอกสารดังกล่าว (แทนที่จะเป็น Intelligent Form Extractor ที่แนะนำก่อนหน้านี้) และแพ็คเกจ DocumentUnderstanding ML ใหม่ (บน CPU) สำหรับการปรับใช้ภายในองค์กรของ UiPath AI Center™ ทำงานบน CPU เท่านั้นและไม่รองรับการเขียนด้วยลายมือ แต่ได้รับการออกแบบมาเพื่อเพิ่มความเร็วในการเรียกใช้เวิร์กโฟลว์และนำเข้าเอกสารไปยังตัวจัดการเอกสาร Document OCR ยังคงฟรีสำหรับการใช้งานแบบไม่จำกัดสำหรับลูกค้าองค์กร UiPath Document Understanding การอัปเดตที่สำคัญอีกประการหนึ่งคือการแสดงตัวอย่างของ Signature Comparison Model ใน AI Center ใน Automation Cloud™ โมเดลนี้ได้รับการฝึกฝนเพื่อกำหนดความคล้ายคลึงกันระหว่างลายเซ็นคู่ จากผลลัพธ์ คุณจะได้รับคะแนนความคล้ายคลึงกันซึ่งบ่งชี้ถึงความเป็นไปได้ที่ลายเซ็นจะมาจากผู้เขียนคนเดียวกัน การตรวจจับลายเซ็นแต่ละอันไม่ได้เป็นส่วนหนึ่งของโมเดลและควรทำล่วงหน้าเพื่อให้อินพุตของโมเดลเป็นเพียงภาพของคู่ของลายเซนต์ ตัวเชื่อม API สำหรับ Twitter และ Campaign Monitor แม้ว่ากรณีการใช้งานอัตโนมัติของ Twitter