Artículo

Discovery y Analytics, una combinación de éxito

La eficiencia es hacer cosas bien; la efectividad es hacer las cosas correctas

Peter Drucker

En la actualidad, nos encontramos ante un complejo escenario en el que confluyen las infinitas posibilidades que ofrecen las grandes cantidades de datos que gestionan las empresas y la necesidad de establecer una estrategia eficiente y eficaz de gobierno/administración de dicha información.

Teniendo en cuanta la realidad descrita, podemos entender que son muchas las preguntas que nos acompañarán en cualquier procedimiento de eDiscovery:

  • ¿Qué información necesito preservar?
  • ¿Debo extraer toda la información de una misma fuente?
  • ¿Por qué tengo elementos duplicados?
  • ¿Qué soluciones pueden ayudar a los revisores de la documentación?
  • ¿Cómo puedo asegurarme que los revisores están revisando de manera consistente?

Para encontrar la solución a éstas y otras muchas preguntas que surgirán a lo largo del ciclo de vida de un proceso de eDiscovery, llevaremos a cabo diferentes acciones y procedimientos cuyo fin, como ya hemos mencionado, es realizar una gestión eficaz y eficiente de la información de la que disponemos. Además, buscaremos obtener un conocimiento profundo de la situación, y a partir de ahí, extraer conclusiones completas, precisas y útiles.

Definición de fuentes y datos: establecimiento del perímetro de elementos (sistemas, redes y datos) y selección de fuentes y grupos de información relevantes derivados del conocimiento específico de la problemática, estructura y la red que integran al cliente, así como haciendo uso de la experiencia en el área de los profesionales de Deloitte.

Análisis de muestras: análisis de subconjuntos del total definido (punto anterior) estableciendo muestras y evaluando el contenido y calidad de la mismas.

Perfilamiento de la información: análisis por capas de la información que nos permite la localización y estudio de patrones, rangos, la distribución por valores y cálculo de volumetrías profundizando en el interés de los datos y permitiéndonos además descubrir aspectos tales como similitudes y/o tendencias.

Búsqueda avanzada: localización de documentos o subgrupos que por su concepto, contenido, hilos o valor presenten una especial criticidad o relevancia.

Categorización: revisión, clasificación y producción de la información que se considere pertinente por parte los miembros de los diferentes equipos de revisión.

Control de calidad: identificación de decisiones de codificación y clasificación erróneas o inconsistentes.

Todos los procesos anteriormente citados nos permiten dar respuesta a una gran variedad de desafíos, teniendo como único denominador común la necesidad de gestionar y clasificar una cantidad considerable de documentación en formato electrónico, una vez más, de forma eficiente y eficaz.

El uso de técnicas y capacidades avanzadas de Analytics permite identificar y resolver posibles situaciones de estrés o conflicto cuando, nos enfrentamos a estos volúmenes crecientes de datos no estructurados y/o contamos con plazos ajustados, ayudándonos además a amplificar nuestros esfuerzos de eDiscovery a través de diferentes técnicas, entre las que destacamos las siguientes:

Identificación de duplicados (Duplicates/Near Duplicates): localiza documentos duplicados o con ligeras variaciones respecto del documento tomado como referencia, reduciendo de forma notable la población objeto de análisis.

Búsqueda conceptual (Conceptual Term Searching): localiza documentos que contienen coincidencias exactas o similares a los términos, frases o párrafos (palabras clave) definidos. No se trata de un glosario de términos definido de antemano, la comparación se realiza con la información existente en la población total a revisar.

Expansión conceptual (Keyword Expansion): devuelve palabras clave que coinciden conceptualmente con el término seleccionado, ayudándonos a identificar palabras que puedan no haber sido recogidas en nuestra propuesta inicial de palabras clave.

Clúster conceptual (Cluster Wheel): lleva a cabo un análisis léxico y taxonómico del total de la información objeto de análisis permitiendo, a través de una visualización interactiva, identificar y agrupar documentos conceptualmente similares.

Generación de hilos (Email threading): agrupa todos los mensajes de correo electróico con sus reenvíos y respuestas permitiendo analizar la comunicación como un conjunto o facilitando la lectura de aquel que agrupe a los anteriores.

Análisis de comunicaciones (Communication Analysis): visualización interactiva que muestras redes de comunicación completas permitiendo identificar de forma sencilla personas de interés, vinculaciones entre personas y conversaciones relacionadas.

Categorización automática (Assisted Review): utilizando un conjunto de documento como ejemplo (ya analizados y categorizados) clasifica otros documentos conceptualmente similares. Dicha solución sigue aprendiendo de las decisiones tomadas por el equipo de revisión ajustando su capacidad de categorización a la realidad definida por el equipo. Es de gran utilidad para priorizar o segmentar el análisis, o realizar controles de calidad sobre la revisión del equipo.

Búsqueda de documentos similares (Similar Documents): utilizando un documento como muestra identifica otros conceptualmente relacionados.

Entendemos esta sinergia de capacidades como un escenario estratégico donde se fusionan a la perfección la estructura (personas) y el plano técnico (herramientas), permitiendo responder de forma coherente, ágil y con un fuerte conocimiento de la información analizada a los diferentes retos que surgen en el contexto de investigaciones, litigios y proceso de eDiscovery en sentido amplio.