lunes, 30 de noviembre de 2015

Papers

Los artículos están en esta carpeta.

Aquí va para cada uno el nombre del archivo, el título, y alguna url.

La idea es que expongan unos 20', y cuenten de qué se trata el artículo. Como notarán, son todos +/- metodológicos, no son de análisis de redes específicas. No hace falta que entiendan el detalle de las partes técnicas, que puede incluir machine learning, o matemática peluda, o matemática fea (algunos autores son físicos), o referencias extensas a trabajos previos. Traten de discernir (y contar) cuál es el problema que el paper aborda, qué concepto o método introduce, cómo se relaciona con el state of the art previo, y cómo validan la propuesta. No den por hecho que el paper es bacán; si les merece dudas, exprésenlas con confianza (en general son papers top y/o de revistas top, pero no es garantía, y en algunos casos son preprints, ni siquiera refereados!). Traté de escoger papers cortos, recientes, abordables, pertinentes e interesantes, pero naturalmente cada uno puedo cojear en uno o varios de esos criterios.

Elijan, y en comentario a este post declaren su elección. No pueden repetirse, así que si alguien declara interés por el artículo antes que ustedes, perdieron y tendrán que escoger otro.

(BTW, la corrección que les había dicho que subiría respecto a la última pregunta de la tarea 2+3, noté que ya la habìa hecho, vean el post; sólo me había faltado avisarles).
  • 01 roles 1312.7258v2. Active discovery of network roles for predicting the classes of network nodes. Url1, Url2. [Cristopher]
  • 02 navigability nphys1130. Navigability of complex networks. Url. Aquí aparece el tema de una "métrica oculta" que puede estar detrás de la navegabilidad de redes "visibles"; lo mencioné muy de pasada en clases.
  • 03 sampling motifs 1507.08696v2. Sampling Motif-Constrained Ensembles of Networks. Url
  • 04 commu0707.0756. Communicability in complex networks. Url
  • 05 ControlLiuEtAl11. Controllability of complex networks. Url
  • 06 control ncomms2939 (y dos archivos más, la info suplementaria y un comentario). Realistic control of network dynamics. Url. Lo ideal sería que alguien tomara este y también el anterior (o que los expongan en la misma sesión, y tal vez los conversen entre los exponentes antes).
  • 07 dk-series_ncomms9627. Quantifying randomness in real networks. Url.
  • 08 nphys2741. Universality in network dynamics. Url
  • 09 comscore-icdm12. Defining and Evaluating Network Communities based on Ground-truth. Es de la 2012 IEEE International Conference on Data Mining. Url
  • 10 1507.04001v1. Structure and inference in annotated networks. Url. [Andrés]
  • 11 srep10611. A Novel Characterization of Amalgamated Networks in Natural Systems. Url
  • 12 srep01467. Profiling core-periphery network structure by random walkers. Url. [Natalia]
  • 45 94_Feizi_NatureBiotechnology_13. Network deconvolution as a general method to distinguish direct dependencies in networks. Url.  [Daniel]
  • 46 1511.06252v1. Network-based recommendation algorithms: A review. Url. Este es por si alguien que tenga experiencia reciente con sistemas de recomendación quiere leerlo y contarnos cuáles son las principales aproximaciones usando redes. [Nicolás]

Si tienen curiosidad de saber el tipo de paper que le tocó a los vecinos de pregrado, pueden intrusear en la carpeta de ellos.

martes, 10 de noviembre de 2015

Tarea 2+3 !

Hola a todos;

si están aquí, ya leyeron el correo, y la tarea ya la tienen; de todos modos, la pueden encontrar aquí. Este post es sólo para que centralicemos eventuales dudas que surjan durante el desarrollo, y así quede una referencia ordenada.

UPDATE 1:

Se me hizo notar que en equipos normales tanto gephi como igraph se niegan a cargar completo el archivo "epinion.net", necesario para la última pregunta de la tarea. No tengo tiempo para hacer una extracción que lo achique sin perder propiedades, así que me limitaré a darles los valores:

  • t0 : 58732
  • t1 : 396548
  • t2 : 451711
  • t3 : 4003085
  • m+ : 592551
  • m :  711782
Con lo que la red se vuelve innecesaria, y la pregunta la empiezan desde la parte (c)... y se convierte en pregunta de papel y lápiz.

jueves, 22 de octubre de 2015

Tarea 1!

Breve tarea para asegurarme de que ya estén manoseando redes. Consiste en elegir una red, y a partir de ella hacer algunos cálculos y visualizaciones básicas con Gephi (bajable en gephi.org; ojo con algunos warning de instalación si lo van a correr en Windows 8).
La red idealmente debiera tener ~1000 nodos, pero eso es sólo en orden de magnitud (digamos, no menos de 250, no más de 2500; de lo contrario o les van a quedar ruidosos los cálculos, o se les va a dificultar la visualización).
Para escoger una red, sugiero mirar la base de datos en https://networkdata.ics.uci.edu/o en las otras fuentes que ellos listan aquíHay algunos datos más en http://konect.uni-koblenz.de/
Las cosas que calcularán no requieren dirección ni pesos en las aristas, pero no es grave si la red que escogen los tiene.
Con la red elegida,
  • Decir qué red es, y de dónde vienen esos datos. Ojo: esto no se refiere sólo a decir "agarré el archivo número 4", sino que mirar la metadata y googlear un poco si hace falta, hasta que sepan qué significan los nodos y aristas, y de dónde salieron esos datos originalmente. Si el dominio no es evidente (p.ej., "red de biogénesis de metabolitos"), agregar algún párrafo que lo contextualice.
  • Dar sus estadísticas básicas: cantidad de nodos, cantidad de aristas/arcos, grado promedio. ¿Es dirigida? ¿Tiene pesos asociados a las aristas? ¿Hay etiquetas? ¿Algún otro tipo de datos asociado?
  • Determine el diámetro de la red y la distancia promedio. Si es dirigida, dé los valores dirigidos y también los no dirigidos.
  • Graficar la distribución de grados. ¿Parece ley de potencia, o es más bien normal?
  • Determine el coeficiente de clustering local, no dirigido (aunque su red sea dirigida). Grafique su distribución. ¿Qué tipo de distribución parece ser?
  • Grafique la red. Juegue un poco con las opciones de layout ("distribución", en gephi hispanoparlante), hasta obtener una imagen que muestre algo de estructura (no una maraña arbitraria de puntos y rayas).
  • Vaya al menú de plugins y descargue alguno de detección de comunidades. Úselo (pero NO use el MCL que viene con la instalación) para identificar posibles comunidades (en la pestaña "Clustering"). ¿Cuantas comunidades se detectaron? ¿De qué tamaños?
  • Use los resultados de ese clustering para colorear nodos (en pestaña "clasificación"). ¿Se ven efectivamente las comunidades en la red dibujada? Adjunte ese gráfico coloreado en su informe.
Envío: informe pdf + red en bruto + archivo de proyecto gephi, al email amoreira@inf.utfsm.cl, hasta el jueves 5.