Noticias

cabecera notica

null Divulgatic: Extracción de datos y detección de malware

Divulgatic: Extracción de datos y detección de malware

Una sección a cargo de Javier García sobre herramientas, recursos, ideas, curiosidades o novedades para creadores de contenidos, desarrolladores, y gente interesada en la tecnología en general 

javier garcía

 

Javier García

Sección de Telemática

 


 

EXTRACCIÓN DE DATOS DE PÁGINAS SIN PROGRAMACIÓN 

 

Muchas veces necesitamos analizar o transformar datos que aparecen en una web. Las hojas de cálculo de Google tienen algunas funciones que nos permiten realizar este trabajo sin tener grandes conocimientos de programación. En concreto disponemos de funciones como IMPORTHTML que podemos combinar con funciones de selección. Por ejemplo, podemos importar al vuelo en una hoja de cálculo, los datos de los ganadores de Eurovisión desde el año 2000 por ejemplo a partir de la información que aparece en la wikipedia.  Para ello primero usamos la función para extraer la tabla.  

 

IMPORTHTML ("https://es.wikipedia.org/wiki/Anexo:Ganadores_del_Festival_de_la_Canci%C3%B3n_de_Eurovisi%C3%B3n"; "table"; 1) 

 

Si queremos seleccionar sólo las primeras columnas y quedarnos aquellas que sean desde el 1980 usamos además la función QUERY

 

=query(IMPORTHTML("https://es.wikipedia.org/wiki/Anexo:Ganadores_del_Festival_de_la_Canci%C3%B3n_de_Eurovisi%C3%B3n"; "table"; 1);"SELECT Col1, Col2, Col3, Col4, Col5 WHERE Col1 >= 1980 ORDER BY Col1 DESC") 

hoja calculo google

O bien podemos por ejemplo importar un CSV para realizar nuestras propias gráficas. Por ejemplo, podemos usar los ficheros .CSV que genera UMU en cifras usando la función IMPORTDATA y hacer un gráfico a partir de los datos de edad Media del año 2022 en distintos colectivos:  

=query(IMPORTDATA("https://www.um.es/umuecws/UMUc/generaFicheros/generaCSV.php?pCodInforme=88");"SELECT * WHERE Col1=2022 AND Col3='7'") 

grafico google

 

COMPROBAR SI UNA URL O UN FICHERO CONTIENE MALWARE 

 

VIRUSTOTAL  

Virustotal es una excelente ayuda cuando no sabemos o tenemos dudas de si una URL o un fichero es o no maliciosa. Al acceder a la misma podemos indicarle cualquiera de las dos opciones y de forma gratuita realiza un escaneo entre su base de datos de antivirus. Además, recientemente ha anunciado la incorporación de Code Insight, que realiza mediante técnicas de IA un análisis del comportamiento fácilmente interpretable por los usuarios del comportamiento del malware. De momento para sólo algunos tipos de ficheros como: PowerShell, Batch, Shell Scripts, VBScript,... 

virus total

 

Gracias por leernos y si conoces alguna que creas que podemos publicar nos la puedes mandar a: divulgatic@um.es