{"id":2640,"date":"2020-10-01T14:01:18","date_gmt":"2020-10-01T17:01:18","guid":{"rendered":"https:\/\/hdbsystems.com.br\/?p=2640"},"modified":"2020-10-01T14:01:18","modified_gmt":"2020-10-01T17:01:18","slug":"ocr-document-understanding-e-computer-vision","status":"publish","type":"post","link":"https:\/\/hdbsystems.com.br\/index.php\/2020\/10\/01\/ocr-document-understanding-e-computer-vision\/","title":{"rendered":"OCR, Document Understanding e Computer Vision"},"content":{"rendered":"\n<p>O Document Understanding, novidade do ano da UiPath, pode executar com precis\u00e3o o entendimento e processamento de v\u00e1rios tipos de dados, gra\u00e7as \u00e0 uni\u00e3o do<a href=\"https:\/\/hdbsystems.com.br\/index.php\/solucoes-2\/\"> OCR, RPA e IA<\/a>.&nbsp;Os dados n\u00e3o estruturados s\u00e3o desafiadores quando a quest\u00e3o \u00e9 leitura e extra\u00e7\u00e3o de informa\u00e7\u00e3o. Por\u00e9m, n\u00e3o h\u00e1 como escapar, visto que eles est\u00e3o em toda parte, escondidos em locais como documentos, arquivos de \u00e1udio, v\u00eddeos, e-mails, imagens, arquivos de log e por a\u00ed vai.&nbsp;<\/p>\n\n\n\n<p>Na pratica, os dados n\u00e3o estruturados correspondem e&nbsp;<a href=\"https:\/\/www.cio.com\/article\/3406806\/ai-unleashes-the-power-of-unstructured-data.html\" target=\"_blank\" rel=\"noreferrer noopener\">80 a 90% de todos os dados<\/a>&nbsp;.&nbsp;No entanto, apesar de sua abund\u00e2ncia e valor, eles continuam sendo um dos recursos corporativos mais desperdi\u00e7ados porque as empresas n\u00e3o possuem as ferramentas necess\u00e1rias para extra\u00ed-los e analis\u00e1-los. Assim, \u00e0 medida que a demanda por an\u00e1lises de big data e automa\u00e7\u00e3o de fluxo de trabalho aumenta, a busca por tecnologias que solucionem esse problema tamb\u00e9m.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>OCR como uma poss\u00edvel solu\u00e7\u00e3o<\/strong><\/h3>\n\n\n\n<p>Um n\u00famero crescente de empresas est\u00e1 utilizando uma tecnologia chamada reconhecimento \u00f3ptico de caracteres (OCR), que torna poss\u00edvel converter texto impresso ou manuscrito em texto codificado por m\u00e1quina.&nbsp;Com o aux\u00edlio de tecnologias como <em>machine learning<\/em>, as ferramentas de OCR conseguem ir melhorando as extra\u00e7\u00f5es de informa\u00e7\u00f5es e a classifica\u00e7\u00e3o dos documentos de forma gradativa.<\/p>\n\n\n\n<p>Por\u00e9m, como uma tecnologia aut\u00f4noma, o OCR n\u00e3o consegue suprir todas as necessidades das empresas na quest\u00e3o de automatiza\u00e7\u00e3o dessas tarefas e um entendimento amis aprofundado dos dados extra\u00eddos.&nbsp;No entanto, por meio da uni\u00e3o de OCR, Robotic Process Automation (RPA) e intelig\u00eancia artificial (AI), as empresas podem habilitar n\u00edveis altamente avan\u00e7ados de processamento de dados e automa\u00e7\u00e3o.<\/p>\n\n\n\n<p>Por isso, a UiPath resolveu unir em suas solu\u00e7\u00f5es de Document Understanding e AI Computer Vision as habilidades do OCR com a IA e a RPA.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Vis\u00e3o Geral e benef\u00edcios do reconhecimento \u00f3tico de caracteres<\/strong><\/h3>\n\n\n\n<p>Em termos gerais, OCR \u00e9 uma tecnologia que converte texto de imagens em documentos edit\u00e1veis. Ele reduz muito e pode at\u00e9 eliminar o trabalho manual, acelerando fluxos de trabalho de back-end enquanto libera os funcion\u00e1rios para assumir responsabilidades mais importantes.<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Automatizando a entrada de dados<\/strong>&#8211; Usando OCR, as empresas podem digitalizar a papelada, minimizando a necessidade de interven\u00e7\u00e3o humana e aumentando a integridade de seus dados.<\/li><li><strong>Edi\u00e7\u00e3o de documentos (digitalizados ou PDF)<\/strong>&#8211; documentos digitalizados e outros que n\u00e3o est\u00e3o em um formato edit\u00e1vel, podem ter seus textos reconhecidos e exportados para um formato leg\u00edvel utilizando um mecanismo de OCR.<\/li><li><strong>Capacita\u00e7\u00e3o de funcion\u00e1rios com defici\u00eancia visual- <\/strong>O reconhecimento \u00f3tico de caracteres pode ajudar convertendo texto escrito em texto para fala, agilizando o processo.<\/li><li><strong>Organiza\u00e7\u00e3o de documentos <\/strong>O OCR pode classificar automaticamente v\u00e1rias pilhas de documentos e organiz\u00e1-los de acordo com regras espec\u00edficas.&nbsp;Um exemplo cl\u00e1ssico seria a organiza\u00e7\u00e3o de faturas com base no tipo ou fornecedor.&nbsp;<\/li><li><strong>Compreender o texto sobre as interfaces<\/strong> O OCR possibilita o processamento de dados em interfaces remotas, tornando mais r\u00e1pido e f\u00e1cil a colabora\u00e7\u00e3o de equipes remotas.<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>As limita\u00e7\u00f5es do OCR<\/strong><\/h3>\n\n\n\n<p>Embora o OCR seja muito poderoso, ele tem algumas limita\u00e7\u00f5es quando usado como uma tecnologia independente.<\/p>\n\n\n\n<div class=\"wp-block-group\"><div class=\"wp-block-group__inner-container is-layout-flow wp-block-group-is-layout-flow\">\n<div class=\"wp-block-group\"><div class=\"wp-block-group__inner-container is-layout-flow wp-block-group-is-layout-flow\">\n<ul class=\"wp-block-list\"><li><strong>N\u00e3o compreende dados por conta pr\u00f3pria<\/strong>&#8211; O OCR n\u00e3o pode compreender ou interpretar dados sem um mecanismo complementar.&nbsp;Para permitir a verdadeira automa\u00e7\u00e3o do processo em escala, OCR e RPA s\u00e3o combinados com AI.<\/li><li><strong>Dificuldade com a variabilidade- &nbsp;<\/strong>Essa solu\u00e7\u00e3o tem dificuldade em lidar com a variabilidade no texto ou layout de um documento, tornando assim o processamento de documentos n\u00e3o estruturados mais dif\u00edcil.<\/li><li><strong>Ele n\u00e3o pode separar documentos-<\/strong> Outros problemas podem surgir se os arquivos precisarem ser separados em documentos ou se houver repeti\u00e7\u00e3o nos campos de \u00edndice ou valores-chave de um fluxo de trabalho.<\/li><li><strong>Sozinho, n\u00e3o \u00e9 preciso ou escalon\u00e1vel- <\/strong> O OCR puro n\u00e3o \u00e9 preciso ou escalon\u00e1vel o suficiente para processos complexos e cognitivos.&nbsp;<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Como o Document Understanding usa o Reconhecimento \u00f3tico de caracteres<\/strong><\/h3>\n\n\n\n<p>O OCR entra em a\u00e7\u00e3o no in\u00edcio do processo, logo depois que a taxonomia \u00e9 carregada no fluxo de trabalho e todos os arquivos e dados s\u00e3o definidos para extra\u00e7\u00e3o. O Document Understanding usa mecanismos de OCR para detectar e digitalizar texto, tornando-o leg\u00edvel por um rob\u00f4.&nbsp;A partir da\u00ed, os documentos s\u00e3o classificados, dados s\u00e3o extra\u00eddos e, se necess\u00e1rio, uma pessoa pode confirmar os dados extra\u00eddos antes de serem exportados para o reposit\u00f3rio relevante (verifica\u00e7\u00e3o).<\/p>\n\n\n\n<p>O UiPath Document Understanding pode utilizar tanto a tecnologia de reconhecimento \u00f3tico de caracteres da UiPath, o&nbsp;<a href=\"https:\/\/docs.uipath.com\/activities\/docs\/ui-path-document-ocr?utm_source=LinkedIn&amp;utm_medium=Social&amp;utm_campaign=DG20RLS&amp;utm_content=Link\" target=\"_blank\" rel=\"noreferrer noopener\">UiPath Document OCR<\/a>&nbsp;, assim como outros mecanismos de OCR, como o da <a href=\"https:\/\/hdbsystems.com.br\/index.php\/captura-inteligente-de-dados\/\">ABBYY<\/a>, empresa l\u00edder no setor.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Como o UiPath AI Computer Vision usa OCR<\/h3>\n\n\n\n<p>\u00c9 imposs\u00edvel automatizar em ambientes virtuais usando OCR e RPA padr\u00e3o porque uma \u00e1rea de trabalho remota \u00e9 apenas um feed de v\u00eddeo.&nbsp;Solu\u00e7\u00f5es avan\u00e7adas s\u00e3o necess\u00e1rias para interpretar o texto e, ainda mais importante, entender seu tipo e finalidade em uma interface.<\/p>\n\n\n\n<p>A AI Computer Vision utiliza uma rede neural avan\u00e7ada com um OCR de tela personalizado desenvolvido na UiPath nos \u00faltimos anos para analisar informa\u00e7\u00f5es em um feed de desktop virtual e entend\u00ea-la, como um ser humano faria.&nbsp;Esta solu\u00e7\u00e3o pode navegar facilmente em qualquer interface dispon\u00edvel, clicando em bot\u00f5es, mas tamb\u00e9m fazendo intera\u00e7\u00f5es complexas como extrair tabelas inteiras e interagir com menus suspensos. <\/p>\n\n\n\n<p>Para identifica\u00e7\u00e3o de elementos, AI Computer Vision usa uma t\u00e9cnica de interpreta\u00e7\u00e3o de texto chamada correspond\u00eancia difusa.&nbsp;Essa t\u00e9cnica permite que os rob\u00f4s UiPath identifiquem o elemento correto a cada vez, mesmo considerando as inconsist\u00eancias dos resultados de OCR, melhorando assim a confiabilidade das automa\u00e7\u00f5es resultantes e encurtando o tempo de desenvolvimento em conjunto.<\/p>\n\n\n\n<p>Vimos aqui que as solu\u00e7\u00f5es de OCR complementam muito bem a RPA. Por\u00e9m, para fluxos complexos e longos, a jun\u00e7\u00e3o dessas tecnologias com a intelig\u00eancia artificial \u00e9 muito ben\u00e9fica. A <span class=\"has-inline-color has-vivid-green-cyan-color\">HDB Systems<\/span> \u00e9 expert em solu\u00e7\u00f5es de OCR e aposta nas tecnologias da UiPath que utilizam essa tecnologia aliada ao poder da automa\u00e7\u00e3o!<\/p>\n\n\n\n<p>Fonte: <a href=\"https:\/\/www.uipath.com\/blog\/unstructured-data-analysis-with-ai-rpa-and-ocr?utm_source=LinkedIn&amp;utm_medium=Social&amp;utm_campaign=DG20RLS&amp;utm_content=Link\">UiPath<\/a><\/p>\n<\/div><\/div>\n<\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>O Document Understanding, novidade do ano da UiPath, pode executar com precis\u00e3o o entendimento e processamento de v\u00e1rios tipos de dados, gra\u00e7as \u00e0 uni\u00e3o do OCR, RPA e IA.&nbsp;Os dados n\u00e3o estruturados s\u00e3o desafiadores quando a quest\u00e3o \u00e9 leitura e extra\u00e7\u00e3o de informa\u00e7\u00e3o. Por\u00e9m, n\u00e3o h\u00e1 como escapar, visto que eles est\u00e3o em toda parte, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":2646,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"off","_et_pb_old_content":"","_et_gb_content_width":"","footnotes":""},"categories":[674],"tags":[785,786,787,788],"class_list":["post-2640","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-rpa","tag-computervision","tag-ocr","tag-opticalcaracterrecognition","tag-reconhecimento-oticodecaracteres"],"_links":{"self":[{"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/posts\/2640","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/comments?post=2640"}],"version-history":[{"count":0,"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/posts\/2640\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/media\/2646"}],"wp:attachment":[{"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/media?parent=2640"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/categories?post=2640"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/hdbsystems.com.br\/index.php\/wp-json\/wp\/v2\/tags?post=2640"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}