Projetos

 

Research

Mineração, Indexação e Visualização de Big Data no Contexto de Sistemas de Apoio a Decisão Clínica - (MIVisBD)

Hoje, quase todas as atividades humanas geram e/ou demandam armazenar e processar conjuntos de dados cada vez maiores, que muitas vezes são diversos e complexos. Esse cenário de crescimento vertiginoso, que ocorre tanto no meio científico, acadêmico, empresarial e até mesmo nas atividades de lazer, demanda novos métodos eficientes para organização e acesso. Tal cenário está sendo chamado como a 'era do big data'. Atividades e sistemas relacionados à saúde estão no centro desse cenário, pois produzem grandes quantidades de dados diversificados e complexos. É importante que avancemos tecnologicamente, de modo a nos beneficiarmos desse volume de dados para ampliar o conhecimento das áreas, de modo, por exemplo, a apoiar o processo de tomada de decisão. Esse apoio à decisão em sistemas complexos está cada vez mais orientado pelas informações extraídas e o que se aprende desses grandes volumes de dados. Em um ambiente clínico, os registos eletrônicos dos pacientes (REP) constituem uma plataforma propícia ao desenvolvimento de estratégias para extração de informações dos pacientes, seus perfis e mesmo de grupos que possuem uma mesma casuística. Neste projeto, pretende-se integrar suportes inovadores de bancos de dados, processamento de imagens e métodos de análise visuais de dados com base em REPs e repositórios de dados clínicos para reunir informações valiosas e significativas para a tomada de decisões que apoiem o diagnóstico e tratamento de pacientes. O tamanho e a complexidade das bases de dados de REPs oferecem grandes desafios de processamento, tanto em termos de desenvolvimento e aplicação de técnicas de análise e de extração de conhecimento, quanto ao apoio ao desenvolvimento de ferramentas práticas para uso clínico. No entanto, também incorporam uma infinidade de oportunidades para criar algoritmos e métodos capazes de exibir informações relevantes relacionadas com um paciente particular ou grupos de pacientes, que estariam usualmente ocultas pelo grande volume de dados. Além disso, uma manipulação eficiente desses dados possui alto potencial para tornar os REPs em uma plataforma mais eficaz para apoiar os profissionais de saúde, lidando com aplicações médicas de rápida demanda bem como decisões governamentais estratégicas em saúde. Neste projeto iremos desenvolver métodos e algoritmos que serão materializados em uma plataforma modular a ser disponibilizada para a comunidade da área, apoiando o cotidiano da tomada de decisões em sistemas de saúde.

Situação: Ativo
Natureza: Pesquisa
Responsável: Agma Juci Machado Traina
Integrantes: Caetano Traina Jr , Marco Antonio Gutierrez , Paulo Mazzoncini de Azevedo Marques , André Guilherme Ribeiro Balan , Christos Faloutsos , Eneida A Mendonca , Fabio Antero Pires , Joaquim Cezar Felipe , Joe Tekli , Jose Eduardo Krieger , José Fernando Rodrigues Júnior , Juan P Casas , Marcel Koenigkam Santos , Marcela Xavier Ribeiro , Marcello Henrique Nogueira-Barbosa , Marina de Fátima de Sá Rebelo , Ramon Alfredo Moreno , Rangaraj Mandayam Rangayyan , Ramon Alfredo Moreno , Renato Bueno , Richard Chbeir , Robson Leonardo Ferreira Cordeiro , Sameer Antani , Solange Oliveira Rezende , Thomas Martin Deserno, né Lehmann , Umberto Tachinardi , Willian Dener de Oliveira
Agradecimentos: Fundação de Amparo à Pesquisa do Estado de São Paulo - FAPESP

Descrição analítica de grafos em escala Web utilizando processamento paralelo assíncrono combinado com técnicas de projeção multi-resolução sobre matrizes de adjacência: aplicações sobre a Web 2.0

Os chamados grafos em escala Web (ou escala planetária) possuem milhões de vértices e bilhões de aresta. Tais grafos têm surgido em diversos contextos contemporâneos contendo informações capazes de explicar comportamentos sociais (Twitter e Facebook), hábitos comerciais (Amazon), estruturas de sistemas (como estradas e redes de computadores), informações não estruturadas (como a Wikipedia), organização de informações (como hipertextos), entre muitas outras. Tais grafos são de valor analítico, pois, além de possuírem ampla informação, há uma tendência a se produzirem cada vez mais destes dados nos próximos anos. Por esta razão, torna-se necessário o desenvolvimento e a maestria sobre técnicas capazes de trabalhar com tais informações. Neste trabalho, propõe-se o uso de técnicas de processamento paralelo assíncrono de grafos combinadas com técnicas de projeção multi-resolução sobre matrizes de adjacência para o processamento não distribuído e para a representação visual de grafos em escala Web. O trabalho se baseará na sistemática GraphChi com o objetivo de desenvolver técnicas analítico-visuais que não necessitem de clusters computacionais, mas sim que tornem a visualização de grandes grafos acessível a sistemas comerciais com um único nó de processamento.

Situação: Ativo
Natureza: Pesquisa
Responsável: Jose F Rodrigues Jr
Integrantes: Robson Cordeiro , Duen Horng Polo Chau , Christos Faloutsos , Hugo Colmenares , Gabriel Gimenes , Gabriel Spadon
Agradecimentos: Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)

Desenvolvimento de Técnicas para Buscas por Similaridade em Sistemas de Gerenciamento de Bases de Dados Complexos Relacionais

Situação: Ativo
Natureza: Pesquisa
Responsável: Caetano Traina Jr
Integrantes: Elaine Parros Machado de Sousa , José Fernando Rodrigues Júnior , Ives Renê Venturini Pola , Luciana Alvim Romani , Robson Leonardo Ferreira Cordeiro , Willian Dener de Oliveira
Agradecimentos: Fundação de Amparo à Pesquisa do Estado de São Paulo

Técnicas fundamentais para Sistemas de Gerenciamento de Bases de Dados Complexos Relacionais

Este projeto trata da incorporação de recursos para recuperação de dados por similaridade em SGBD Relacionais, desenvolvendo técnicas básicas que cubram as principais necessidades dos quatro módulos principais de um SGBD, atendendo às necessidades de armazenagem, recuperação e análise de dados complexos por similaridade de maneira integrada à armazenagem e recuperação de dados escalares, incluindo: - A integração da representação de consultas por similaridade em uma extensão da linguagem SQL; - A definição unificada dos operadores algébricos por similaridade segundo a teoria relacional, como operadores interoperáveis com os tradicionais e a representação interna das consultas atendendo a Álgebra Relacional; - O desenvolvimento de técnicas para otimização lógica e física dos planos de execução de consultas; e - O desenvolvimento de técnicas para indexação e recuperação eficiente em combinações de operações de busca por similaridade, por identidade e por ROT..

Situação: Ativo
Natureza: Pesquisa
Responsável: Caetano Traina Jr
Integrantes: Willian Dener de Oliveira
Agradecimentos: Conselho Nacional de Desenvolvimento Científico e Tecnológico

Mineração de Imagens e Recuperação Perceptual de Imagens por Conteúdo para Sistemas de Apoio ao Diagnóstico Médico

A proposta deste projeto consiste em promover a aproximação dos sistemas de recuperação de imagens por conteúdo (CBIR) à realidade médica e explorar sua capacidade em Sistemas de Auxílio ao Diagnóstico (Computer-Aided Diagnosis) por imagens integrando essas duas novas abordagens: percepção do especialista e perfil do usuário no processo de recuperação e de mineração de imagens médicas. Para isso, serão disponibilizadas aos sistemas CBIR técnicas e ferramentas que permitam incorporar a perspectiva de análise de imagens e dados do ponto de vista do conhecimento do especialista, diminuindo o gap semântico. A inclusão da percepção do especialista e dos perfis dos usuários na construção de ferramentas CBIR irá aproximar essa tecnologia do especialista médico, quebrando a barreira entre a ciência médica e a ciência da computação

Situação: Ativo
Natureza: Pesquisa
Responsável: Agma Juci Machado Traina
Integrantes: Caetano Traina Jr , Renato Bueano , Elaine Parros Machado de Sousa , Marcela Xavier Ribeiro , Pedro Bugatti , Willian Dener de Oliveira
Agradecimentos: Conselho Nacional de Desenvolvimento Científico e Tecnológico

AgroDatamine

O aquecimento global e suas conseqüências trazem novos desafios para os pesquisadores do Século XXI. Apesar da comunidade científica não ter dúvidas sobre o aquecimento do planeta, é premente a identificação das causas do aumento da temperatura média global, bem como a quantificação desse aquecimento e suas consequências para os ecossistemas. Modelos matemáticos e estatísticos têm sido empregados para analisar os possíveis cenários futuros e consequentemente uma grande quantidade de dados tem sido gerada. Além disso, o avanço tecnológico tem propiciado melhorias nos diversos sensores utilizados para medições de dados climáticos e de imageamento da superfície terrestre, contribuindo para o aumento na quantidade e complexidade dos dados gerados. As pesquisas envolvendo grande volume e diversidade de dados remete a dois dos Grandes Desafios da Computação: a gestão da informação em grandes volumes de dados e a modelagem computacional de sistemas complexos. Neste contexto, este projeto de pesquisa propõe investigar e desenvolver técnicas e métodos computacionais para analisar os conjuntos de dados complexos utilizados por meteorologistas e agrometeorologistas, para auxiliá-los nas pesquisas sobre os impactos das mudanças climáticas na agricultura brasileira. Em linhas gerais, o objetivo deste projeto é desenvolver métodos para analisar os resultados dos modelos regionais de prognóstico de mudanças climáticas e compará-los com medidas reais coletadas pelas estações de superfície, a fim de avaliar a qualidade dos dados gerados e dar subsídios para a calibração dos modelos de previsão. Adicionalmente, pretende-se desenvolver novos métodos para filtrar, analisar e extrair padrões da associação entre dados climáticos e dados extraídos de sensores remotos para auxiliar nas pesquisas agrícolas. O projeto embasa-se na parceria de pesquisadores do Grupo de Bases de Dados e Imagens (GBdI) do ICMC-USP, da Embrapa Informática Agropecuária, do Centro de Pesquisas Meteorológicas e Climáticas Aplicadas à Agricultura (Cepagri) da Unicamp, e do Departamento de Computação e Unidade de Sorocaba da UFSCar. Como referencial de pesquisa, propõe-se a Mineração de Dados e a Teoria dos Fractais associadas a técnicas de Visualização da Informação. Os resultados esperados no projeto irão contribuir para o avanço no estado da arte em mineração de dados, com reflexos na área de agrometeorologia, e para melhorias nas saídas dos modelos regionais de previsão de mudanças climáticas.

Situação: Finalizado
Natureza: Pesquisa
Responsável: Agma Juci Machado Traina
Integrantes: Caetano Traina Jr , Renato Bueno , Marcela Xavier Ribeiro , Humberto Luiz Razente , Adriano Arantes Paterlini , Elaine Parros de Sousa , José Fernando Rodrigues Jr. , Pedro Bugatti , Luciana Alvim Romani , Maria Camila Nardini Barioni , Daniel Kaster , Jurandir Zullo Jr. , Renata Gonçalves , Ana Maria H. Avila , Letrícia Pereira Soares Avalhais
Agradecimentos: Fundação de Amparo à Pesquisa do Estado de São Paulo / Microsoft

Development

BowFire Dataset

Situação: Ativo
Natureza: Desenvolvimento
Responsável: Agma Juci Machado Traina
Integrantes: Willian Dener de Oliveira
Agradecimentos:

Arboretm

Situação: Ativo
Natureza: Desenvolvimento
Responsável: Caetano Traina Jr
Integrantes: Willian Dener de Oliveira
Agradecimentos: