{"id":1149,"date":"2020-04-08T16:58:07","date_gmt":"2020-04-08T14:58:07","guid":{"rendered":"https:\/\/www.cytomic.ai\/noticias\/id-700045\/"},"modified":"2020-04-15T13:31:42","modified_gmt":"2020-04-15T11:31:42","slug":"id-700045","status":"publish","type":"post","link":"https:\/\/www.cytomic.ai\/es\/soporte\/id-700045\/","title":{"rendered":"\u00bfC\u00f3mo construir b\u00fasquedas compatibles con el proceso de normalizaci\u00f3n?"},"content":{"rendered":"[vc_row type=&#8221;full_width_background&#8221; full_screen_row_position=&#8221;middle&#8221; equal_height=&#8221;yes&#8221; content_placement=&#8221;middle&#8221; column_margin=&#8221;default&#8221; bg_color=&#8221;#7e5994&#8243; scene_position=&#8221;center&#8221; text_color=&#8221;light&#8221; text_align=&#8221;left&#8221; top_padding=&#8221;12&#8243; bottom_padding=&#8221;12&#8243; overlay_strength=&#8221;0.3&#8243; shape_divider_position=&#8221;bottom&#8221; bg_image_animation=&#8221;none&#8221; shape_type=&#8221;&#8221;][vc_column column_padding=&#8221;no-extra-padding&#8221; column_padding_position=&#8221;all&#8221; background_color_opacity=&#8221;1&#8243; background_hover_color_opacity=&#8221;1&#8243; column_link_target=&#8221;_self&#8221; column_shadow=&#8221;none&#8221; column_border_radius=&#8221;none&#8221; width=&#8221;3\/5&#8243; tablet_width_inherit=&#8221;default&#8221; tablet_text_alignment=&#8221;default&#8221; phone_text_alignment=&#8221;default&#8221; overlay_strength=&#8221;0.3&#8243; column_border_width=&#8221;none&#8221; column_border_style=&#8221;solid&#8221; bg_image_animation=&#8221;none&#8221;][\/vc_column][vc_column column_padding=&#8221;no-extra-padding&#8221; column_padding_position=&#8221;all&#8221; background_color_opacity=&#8221;1&#8243; background_hover_color_opacity=&#8221;1&#8243; column_link_target=&#8221;_self&#8221; column_shadow=&#8221;none&#8221; column_border_radius=&#8221;none&#8221; width=&#8221;1\/5&#8243; tablet_width_inherit=&#8221;default&#8221; tablet_text_alignment=&#8221;default&#8221; phone_text_alignment=&#8221;default&#8221; overlay_strength=&#8221;0.3&#8243; column_border_width=&#8221;none&#8221; column_border_style=&#8221;solid&#8221; bg_image_animation=&#8221;none&#8221;]<div class=\"iwithtext\"><div class=\"iwt-icon\"> <img decoding=\"async\" src=\"https:\/\/www.cytomic.ai\/src\/uploads\/2020\/03\/support-tiny.svg\" alt=\"\" \/> <\/div><div class=\"iwt-text\"> +34 900 840 407 <\/div><div class=\"clear\"><\/div><\/div>[\/vc_column][vc_column column_padding=&#8221;no-extra-padding&#8221; column_padding_position=&#8221;all&#8221; background_color_opacity=&#8221;1&#8243; background_hover_color_opacity=&#8221;1&#8243; column_link_target=&#8221;_self&#8221; column_shadow=&#8221;none&#8221; column_border_radius=&#8221;none&#8221; width=&#8221;1\/5&#8243; tablet_width_inherit=&#8221;default&#8221; tablet_text_alignment=&#8221;default&#8221; phone_text_alignment=&#8221;default&#8221; overlay_strength=&#8221;0.3&#8243; column_border_width=&#8221;none&#8221; column_border_style=&#8221;solid&#8221; bg_image_animation=&#8221;none&#8221;]<div class=\"iwithtext\"><div class=\"iwt-icon\"> <img decoding=\"async\" src=\"https:\/\/www.cytomic.ai\/src\/uploads\/2020\/03\/contact-tiny.svg\" alt=\"\" \/> <\/div><div class=\"iwt-text\"> support@cytomic.ai <\/div><div class=\"clear\"><\/div><\/div>[\/vc_column][\/vc_row][vc_row type=&#8221;full_width_content&#8221; full_screen_row_position=&#8221;middle&#8221; equal_height=&#8221;yes&#8221; content_placement=&#8221;top&#8221; column_margin=&#8221;default&#8221; scene_position=&#8221;center&#8221; text_color=&#8221;dark&#8221; text_align=&#8221;left&#8221; overlay_strength=&#8221;0.3&#8243; shape_divider_position=&#8221;bottom&#8221; bg_image_animation=&#8221;none&#8221; shape_type=&#8221;&#8221;][vc_column column_padding=&#8221;padding-5-percent&#8221; column_padding_position=&#8221;all&#8221; background_color=&#8221;#f3f3f3&#8243; background_color_opacity=&#8221;1&#8243; background_hover_color_opacity=&#8221;1&#8243; column_link_target=&#8221;_self&#8221; column_shadow=&#8221;none&#8221; column_border_radius=&#8221;none&#8221; width=&#8221;1\/3&#8243; tablet_width_inherit=&#8221;default&#8221; tablet_text_alignment=&#8221;default&#8221; phone_text_alignment=&#8221;default&#8221; overlay_strength=&#8221;0.3&#8243; column_border_width=&#8221;none&#8221; column_border_style=&#8221;solid&#8221; bg_image_animation=&#8221;none&#8221;][split_line_heading animation_type=&#8221;default&#8221;]<a href=\"#title1\">Productos relacionados<\/a><\/p>\n<p><a href=\"#title2\">Caracteres de separaci\u00f3n<\/a><\/p>\n<p><a href=\"#title3\">Transformaci\u00f3n<\/a><\/p>\n<p><a href=\"#title4\">Reglas generales<\/a><\/p>\n<p><a href=\"#title6\">Consejos para las b\u00fasquedas<\/a>[\/split_line_heading][\/vc_column][vc_column column_padding=&#8221;padding-5-percent&#8221; column_padding_position=&#8221;all&#8221; background_color_opacity=&#8221;1&#8243; background_hover_color_opacity=&#8221;1&#8243; column_link_target=&#8221;_self&#8221; column_shadow=&#8221;none&#8221; column_border_radius=&#8221;none&#8221; width=&#8221;2\/3&#8243; tablet_width_inherit=&#8221;default&#8221; tablet_text_alignment=&#8221;default&#8221; phone_text_alignment=&#8221;default&#8221; overlay_strength=&#8221;0.3&#8243; column_border_width=&#8221;none&#8221; column_border_style=&#8221;solid&#8221; bg_image_animation=&#8221;none&#8221;][vc_column_text]\n<h3>\u00bfC\u00f3mo construir b\u00fasquedas compatibles con el proceso de normalizaci\u00f3n de Cytomic Data Watch?<\/h3>\n[\/vc_column_text][vc_column_text css=&#8221;.vc_custom_1586358286772{padding-top: 40px !important;padding-bottom: 20px !important;}&#8221;]\n<h6 id=\"title1\">Productos relacionados_<\/h6>\n[\/vc_column_text][vc_column_text]\n<ul>\n<li>Cytomic Data Watch<\/li>\n<\/ul>\n[\/vc_column_text][vc_column_text css=&#8221;.vc_custom_1586358840684{padding-top: 40px !important;padding-bottom: 20px !important;}&#8221;]\n<h6 id=\"title2\">Introducci\u00f3n_<\/h6>\n[\/vc_column_text][vc_column_text]\n<div>Los datos extra\u00eddos de los ficheros encontrados en el equipo del usuario se almacenan en una base de datos en el propio equipo tras aplicar un proceso de normalizaci\u00f3n. Este proceso var\u00eda si Cytomic Data Watch considera el dato como una entidad PII (Personally Identifiable Information) o un texto sin identificar.<\/div>\n<div>El proceso de normalizaci\u00f3n afecta de forma directa a las b\u00fasquedas, ya que se compara esta con los datos almacenados despu\u00e9s de sufrir el proceso de normalizaci\u00f3n. Es decir, la b\u00fasqueda se ejecuta sobre los datos normalizados y no sobre los datos originales contenidos en los ficheros del usuario.<\/div>\n<div>Veamos a continuaci\u00f3n algunos aspectos que forman parte de este proceso de normalizaci\u00f3n:<\/div>\n[\/vc_column_text][vc_column_text css=&#8221;.vc_custom_1586358261599{padding-top: 40px !important;padding-bottom: 20px !important;}&#8221;]\n<h6 id=\"title2\">Caracteres de separaci\u00f3n_<\/h6>\n[\/vc_column_text][vc_column_text]\n<div>Cytomic Data Watch maneja un grupo de caracteres especiales que considera como separadores entre palabras y que puede retirar completamente o sustituir por un \u00fanico espacio. El grupo de caracteres es el siguiente:<\/div>\n<ul>\n<li>Retorno de carro: \\r<\/li>\n<li>Salto de l\u00ednea: \\n<\/li>\n<li>Tabulador: \\t<\/li>\n<li>Caracteres: &#8221; : ; ! ? &#8211; + _ * = ( ) [ ] { } , . | % \\ \/ \u2019<\/li>\n<\/ul>\n[\/vc_column_text][vc_column_text css=&#8221;.vc_custom_1586358316272{padding-top: 40px !important;padding-bottom: 20px !important;}&#8221;]\n<h6 id=\"title3\">Transformaci\u00f3n de caracteres_<\/h6>\n[\/vc_column_text][vc_column_text]Independientemente de que la cadena de caracteres sea reconocida como una entidad o no, antes de almacenarla en la base de datos se transforma a min\u00fasculas. Las b\u00fasquedas del administrador tambi\u00e9n son transformadas a min\u00fasculas, con lo que escribir en may\u00fasculas o min\u00fasculas no afecta al resultado de la b\u00fasqueda.[\/vc_column_text][vc_column_text css=&#8221;.vc_custom_1586359053002{padding-top: 40px !important;padding-bottom: 20px !important;}&#8221;]\n<h6 id=\"title4\">Reglas generales para normalizar los datos reconocidos como una entidad_<\/h6>\n[\/vc_column_text][vc_column_text]\n<ul>\n<li>Las entidades formadas por caracteres num\u00e9ricos (tel\u00e9fonos, n\u00fameros de cuentas bancarias etc.) se elimina el conjunto de caracteres separadores y se almacena la cadena resultante como una \u00fanica entidad. Por ejemplo \u201c1.42.65.116-C\u201d se almacena como la entidad de tipo IDCARD \u201c14265116C\u201d.<\/li>\n<li>Las entidades de tipo Direcci\u00f3n IP y Correo electr\u00f3nico se almacenan tal cual.<\/li>\n<li>Las entidades Nombre y Apellidos y Direcci\u00f3n cada palabra se almacena de forma independiente y se eliminan las que contengan n\u00fameros. Por ejemplo \u201cCalle Santiago de Compostela 5 1\u00ba Izquierda\u201d se almacenar\u00e1 como \u201ccalle\u201d, \u201csantiago\u201d, \u201cde\u201d, \u201ccompostela\u201d, \u201cizquierda\u201d.<\/li>\n<\/ul>\n[\/vc_column_text][vc_column_text css=&#8221;.vc_custom_1586847958607{padding-top: 40px !important;padding-bottom: 20px !important;}&#8221;]\n<h6 id=\"title5\">Reglas generales para normalizar los datos no reconocidos como una entidad_<\/h6>\n[\/vc_column_text][vc_column_text]\n<ul>\n<li>Los datos num\u00e9ricos y alfanum\u00e9ricos (palabras formadas por letras y n\u00fameros) que no sean detectadas como una entidad son eliminados en el proceso de normalizaci\u00f3n, y por lo tanto su b\u00fasqueda no devuelve ning\u00fan resultado.<\/li>\n<li>Cada car\u00e1cter de separaci\u00f3n encontrado divide la cadena de caracteres en dos palabras independientes e impide el almacenamiento del car\u00e1cter separador. Por ejemplo la cadena \u201ccasa.bosque\u201d se almacena como \u201ccasa\u201d y \u201cbosque\u201d y el car\u00e1cter separador \u201c.\u201d se descarta.<\/li>\n<\/ul>\n[\/vc_column_text][vc_column_text css=&#8221;.vc_custom_1586847967121{padding-top: 40px !important;padding-bottom: 20px !important;}&#8221;]\n<h6 id=\"title6\">Consejos para construir b\u00fasquedas compatibles con el proceso de normalizaci\u00f3n_<\/h6>\n[\/vc_column_text][vc_column_text]\n<ul>\n<li>Utiliza preferiblemente letras en min\u00fasculas.<\/li>\n<li>Los caracteres num\u00e9ricos que forman parte de cadenas que no son identificados como una entidad compatible con Cytomic Data Watch se eliminan en el proceso de normalizaci\u00f3n, y por tanto no deben ser incluidos en las b\u00fasquedas.<\/li>\n<li>Para buscar n\u00fameros de cuentas bancarias, n\u00fameros de tarjetas de cr\u00e9dito, n\u00fameros de identidad, n\u00fameros de la seguridad social, n\u00fameros de pasaporte, n\u00fameros de permiso elimina los caracteres de separaci\u00f3n.<\/li>\n<li>Para buscar direcciones IP y direcciones de correo electr\u00f3nico introd\u00facelas tal cual.<\/li>\n<li>Para buscar n\u00fameros de tel\u00e9fono elimina los caracteres de separaci\u00f3n, introduciendo el c\u00f3digo del pa\u00eds si es necesario sin el signo \u201c+\u201d.<\/li>\n<li>Para buscar direcciones f\u00edsicas, nombres y apellidos elimina los caracteres num\u00e9ricos.<\/li>\n<\/ul>\n[\/vc_column_text][\/vc_column][\/vc_row]\n","protected":false},"excerpt":{"rendered":"<p>[vc_row type=&#8221;full_width_background&#8221; full_screen_row_position=&#8221;middle&#8221; equal_height=&#8221;yes&#8221; content_placement=&#8221;middle&#8221; column_margin=&#8221;default&#8221; bg_color=&#8221;#7e5994&#8243; scene_position=&#8221;center&#8221; text_color=&#8221;light&#8221; text_align=&#8221;left&#8221; top_padding=&#8221;12&#8243; bottom_padding=&#8221;12&#8243; overlay_strength=&#8221;0.3&#8243; shape_divider_position=&#8221;bottom&#8221; bg_image_animation=&#8221;none&#8221; shape_type=&#8221;&#8221;][vc_column column_padding=&#8221;no-extra-padding&#8221; column_padding_position=&#8221;all&#8221; background_color_opacity=&#8221;1&#8243; background_hover_color_opacity=&#8221;1&#8243; column_link_target=&#8221;_self&#8221; column_shadow=&#8221;none&#8221; column_border_radius=&#8221;none&#8221; width=&#8221;3\/5&#8243; tablet_width_inherit=&#8221;default&#8221; tablet_text_alignment=&#8221;default&#8221; phone_text_alignment=&#8221;default&#8221; overlay_strength=&#8221;0.3&#8243; column_border_width=&#8221;none&#8221; column_border_style=&#8221;solid&#8221;&#8230;<\/p>\n","protected":false},"author":4,"featured_media":414,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[32,33,40,27],"tags":[],"class_list":{"0":"post-1149","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-edr","8":"category-epdr","9":"category-data-watch","10":"category-soporte"},"_links":{"self":[{"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/posts\/1149","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/comments?post=1149"}],"version-history":[{"count":6,"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/posts\/1149\/revisions"}],"predecessor-version":[{"id":1253,"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/posts\/1149\/revisions\/1253"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/media\/414"}],"wp:attachment":[{"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/media?parent=1149"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/categories?post=1149"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.cytomic.ai\/es\/wp-json\/wp\/v2\/tags?post=1149"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}