15 octubre 2010

InfoChimps: El mercado de información en internet, su API y funcionalidades

Es una empresa dedicada al a distribución de datasets[1] para su posterior tratamiento en técnicas de Data mining[2]. InfoChimps se puede considerar como un mercado de “información”, donde cualquiera puede poner a la venta o compartir de forma gratuita todo conjunto de datos que se haya recolectado.
InfoChimps no solo es un mercado de información, también contiene un API la cual de una manera mucho más sencilla permite la utilización de varios de los datasets que contiene, los datasets Api son las siguientes:
  • Twitter: Dataset del microbolg Twitter, en la actualizad cuenta con más de 50 millones de usuarios y 1600 millones de tweets. Se han recopilado datos de Twitter desde 2008, con tweets que van desde marzo 2006. Las consultas que se pueden realizar a la API son:
      • Trstrank: métrica de reputación para los usuarios de Twitter.
      • Wordbag: proporciona las 100 palabras más características de un usuario de Twitter.
      • Influence: Análisis de las cualidades de un usuario en Twitter.
      • Conversation: La interacción entre dos usuarios de Twitter.
      • Strong links: Relación de los usuarios de Twitter según su interacción (replies, retweets, mentions). Por ejemplo, si tú envías replies todos los días a otro usuario, el strong link entre ambos será elevado.
      • Word Usage: Proporciona la frecuencia de uso y dispersión de las palabras utilizadas en los tweets.
      • Whois (en desarrollo): Twitter mantiene 2 Ids distintas (una para la REST API y otra para search API) para un usuario de Twitter, esta función permitirá en un futuro la conversión de un nombre del usuario de twitter en su Id para REST API o search API.
  • Digital Element (de pago): Es el principal proveedor de datos geolocalizados mediante IP, los métodos que proporciona son:
      • Demographics: Datos demográficos según IP.
      • Domains: Proporciona los dominios que proporcionan la IP.
      • Geographic Locations: Información sobre la ubicación geográfica de la IP.
  • Census (solo datos USA): Información censal basándose en la dirección IP, dispone de más de 2000 datos censales pertenecientes a Estados Unidos.
------------------------------------------------------------------------
[1] Dataset: conjunto organizado de información
[2] Data mining: es el proceso de analizar un conjunto de datos (datasets) con el objetivo de resumir los datos en segmentos de información útil.