Projects

 

Research

Mining, Indexing and Visualizing Big Data in Clinical Decision Support Systems - (MIVisBD)

Today, almost every human activity generates and/or demands to store and process massive, diverse and complex data, either in scientific, academic, enterprise and even leisure pursuits - the scenario being called as the big data era. Health-related activities are in the core of those activities, as they produce big data as well as they can take advantage of the technological storm, improving the behavior of everyone whose decision is increasingly guided by the information extracted from all these big data. In a clinical environment, the Electronic Health Records (EHR) forms a proper anchor to develop information extraction strategies. In this proposal, we aim at integrating novel database support, image processing and visual analytics methods to leverage the large number of EHR and repositories of clinical data to gather valuable and significant information for decision-making. The size and complexity of EHR databases offer great challenges when they need to be processed in terms both of applying analysis techniques and to support the development of subsequent applications for practical tools. However, it also embodies a cornucopia of opportunities to create algorithms and methods able to display smart and relevant information related to either a particular patient or groups of patients and to boost the EHR into a more effective platform to support the healthcare professionals, coping medical applications and strategic government decisions with the demands and benefits of big data. In this project we will develop methods and algorithms that will ultimately be materialized as a modular platform to be made available to the community.

Situation: Ativo
Category: Research
Responsible: Agma Juci Machado Traina
Members: Caetano Traina Jr , Marco Antonio Gutierrez , Paulo Mazzoncini de Azevedo Marques , André Guilherme Ribeiro Balan , Christos Faloutsos , Eneida A Mendonca , Fabio Antero Pires , Joaquim Cezar Felipe , Joe Tekli , Jose Eduardo Krieger , José Fernando Rodrigues Júnior , Juan P Casas , Marcel Koenigkam Santos , Marcela Xavier Ribeiro , Marcello Henrique Nogueira-Barbosa , Marina de Fátima de Sá Rebelo , Ramon Alfredo Moreno , Rangaraj Mandayam Rangayyan , Ramon Alfredo Moreno , Renato Bueno , Richard Chbeir , Robson Leonardo Ferreira Cordeiro , Sameer Antani , Solange Oliveira Rezende , Thomas Martin Deserno, né Lehmann , Umberto Tachinardi , Willian Dener de Oliveira
Acknowledgements: Fundação de Amparo à Pesquisa do Estado de São Paulo - FAPESP

Descrição analítica de grafos em escala Web utilizando processamento paralelo assíncrono combinado com técnicas de projeção multi-resolução sobre matrizes de adjacência: aplicações sobre a Web 2.0

The so-called Web-scale (or planetary-scale) graphs comprise millions of vertices and billions of edges. Such graphs have appeared in several contemporaneous contexts containing information that can potentially explain social behavior (Twitter and Facebook), commercial activities (Amazon), system structures (like roads and computer networks), non-structured information (Wikipedia), information organization (hypertext), to name a few. These graphs are of great analytical value because, besides having a wide range of information, the current trend is that more of such datasets will appear in the following years. For this reason, it becomes necessary the development and the mastering of techniques capable of working with such volumes of information. In this work, we propose to use asynchronous parallel processing of graphs combined with multi-resolution projection techniques applied over adjacency matrices to process and to visually represent Web-scale graphs. The work will based on system GraphChi within the goals of developing analytic-visual techniques that do not demand computational clusters, but, instead, turn the visualization of large graphs accessible to commercial systems with a single processing node.

Situation: Ativo
Category: Research
Responsible: Jose F Rodrigues Jr
Members: Robson Cordeiro , Duen Horng Polo Chau , Christos Faloutsos , Hugo Colmenares , Gabriel Gimenes , Gabriel Spadon
Acknowledgements: Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)

Desenvolvimento de Técnicas para Buscas por Similaridade em Sistemas de Gerenciamento de Bases de Dados Complexos Relacionais

Situation: Ativo
Category: Research
Responsible: Caetano Traina Jr
Members: Elaine Parros Machado de Sousa , José Fernando Rodrigues Júnior , Ives Renê Venturini Pola , Luciana Alvim Romani , Robson Leonardo Ferreira Cordeiro , Willian Dener de Oliveira
Acknowledgements: Fundação de Amparo à Pesquisa do Estado de São Paulo

Técnicas fundamentais para Sistemas de Gerenciamento de Bases de Dados Complexos Relacionais

Este projeto trata da incorporação de recursos para recuperação de dados por similaridade em SGBD Relacionais, desenvolvendo técnicas básicas que cubram as principais necessidades dos quatro módulos principais de um SGBD, atendendo às necessidades de armazenagem, recuperação e análise de dados complexos por similaridade de maneira integrada à armazenagem e recuperação de dados escalares, incluindo: - A integração da representação de consultas por similaridade em uma extensão da linguagem SQL; - A definição unificada dos operadores algébricos por similaridade segundo a teoria relacional, como operadores interoperáveis com os tradicionais e a representação interna das consultas atendendo a Álgebra Relacional; - O desenvolvimento de técnicas para otimização lógica e física dos planos de execução de consultas; e - O desenvolvimento de técnicas para indexação e recuperação eficiente em combinações de operações de busca por similaridade, por identidade e por ROT..

Situation: Ativo
Category: Research
Responsible: Caetano Traina Jr
Members: Willian Dener de Oliveira
Acknowledgements: Conselho Nacional de Desenvolvimento Científico e Tecnológico

Mineração de Imagens e Recuperação Perceptual de Imagens por Conteúdo para Sistemas de Apoio ao Diagnóstico Médico

A proposta deste projeto consiste em promover a aproximação dos sistemas de recuperação de imagens por conteúdo (CBIR) à realidade médica e explorar sua capacidade em Sistemas de Auxílio ao Diagnóstico (Computer-Aided Diagnosis) por imagens integrando essas duas novas abordagens: percepção do especialista e perfil do usuário no processo de recuperação e de mineração de imagens médicas. Para isso, serão disponibilizadas aos sistemas CBIR técnicas e ferramentas que permitam incorporar a perspectiva de análise de imagens e dados do ponto de vista do conhecimento do especialista, diminuindo o gap semântico. A inclusão da percepção do especialista e dos perfis dos usuários na construção de ferramentas CBIR irá aproximar essa tecnologia do especialista médico, quebrando a barreira entre a ciência médica e a ciência da computação

Situation: Ativo
Category: Research
Responsible: Agma Juci Machado Traina
Members: Caetano Traina Jr , Renato Bueano , Elaine Parros Machado de Sousa , Marcela Xavier Ribeiro , Pedro Bugatti , Willian Dener de Oliveira
Acknowledgements: Conselho Nacional de Desenvolvimento Científico e Tecnológico

AgroDataMine: Desenvolvimento de Métodos e Técnicas de Mineração de Dados para Apoiar Pesquisas em Mudanças Climáticas com Ênfase em Agrometeorologia

O aquecimento global e suas conseqüências trazem novos desafios para os pesquisadores do Século XXI. Apesar da comunidade científica não ter dúvidas sobre o aquecimento do planeta, é premente a identificação das causas do aumento da temperatura média global, bem como a quantificação desse aquecimento e suas consequências para os ecossistemas. Modelos matemáticos e estatísticos têm sido empregados para analisar os possíveis cenários futuros e consequentemente uma grande quantidade de dados tem sido gerada. Além disso, o avanço tecnológico tem propiciado melhorias nos diversos sensores utilizados para medições de dados climáticos e de imageamento da superfície terrestre, contribuindo para o aumento na quantidade e complexidade dos dados gerados. As pesquisas envolvendo grande volume e diversidade de dados remete a dois dos Grandes Desafios da Computação: a gestão da informação em grandes volumes de dados e a modelagem computacional de sistemas complexos. Neste contexto, este projeto de pesquisa propõe investigar e desenvolver técnicas e métodos computacionais para analisar os conjuntos de dados complexos utilizados por meteorologistas e agrometeorologistas, para auxiliá-los nas pesquisas sobre os impactos das mudanças climáticas na agricultura brasileira. Em linhas gerais, o objetivo deste projeto é desenvolver métodos para analisar os resultados dos modelos regionais de prognóstico de mudanças climáticas e compará-los com medidas reais coletadas pelas estações de superfície, a fim de avaliar a qualidade dos dados gerados e dar subsídios para a calibração dos modelos de previsão. Adicionalmente, pretende-se desenvolver novos métodos para filtrar, analisar e extrair padrões da associação entre dados climáticos e dados extraídos de sensores remotos para auxiliar nas pesquisas agrícolas. O projeto embasa-se na parceria de pesquisadores do Grupo de Bases de Dados e Imagens (GBdI) do ICMC-USP, da Embrapa Informática Agropecuária, do Centro de Pesquisas Meteorológicas e Climáticas Aplicadas à Agricultura (Cepagri) da Unicamp, e do Departamento de Computação e Unidade de Sorocaba da UFSCar. Como referencial de pesquisa, propõe-se a Mineração de Dados e a Teoria dos Fractais associadas a técnicas de Visualização da Informação. Os resultados esperados no projeto irão contribuir para o avanço no estado da arte em mineração de dados, com reflexos na área de agrometeorologia, e para melhorias nas saídas dos modelos regionais de previsão de mudanças climáticas.

Situation: Finalizado
Category: Research
Responsible: Agma Juci Machado Traina
Members: Caetano Traina Jr , Renato Bueno , Marcela Xavier Ribeiro , Humberto Luiz Razente , Adriano Arantes Paterlini , Elaine Parros de Sousa , José Fernando Rodrigues Jr. , Pedro Bugatti , Luciana Alvim Romani , Maria Camila Nardini Barioni , Daniel Kaster , Jurandir Zullo Jr. , Renata Gonçalves , Ana Maria H. Avila , Letrícia Pereira Soares Avalhais
Acknowledgements: Fundação de Amparo à Pesquisa do Estado de São Paulo / Microsoft

Development

BowFire Dataset

Situation: Ativo
Category: Development
Responsible: Agma Juci Machado Traina
Members: Willian Dener de Oliveira
Acknowledgements:

Arboretum

Situation: Ativo
Category: Development
Responsible: Caetano Traina Jr
Members: Willian Dener de Oliveira
Acknowledgements: