Nearly every human activity generates and requires the storage and processing of vast amounts of diverse and complex data across scientific, academic, business, and leisure domains. Health-related activities are no exception, producing large-scale data that can benefit from technological advancements to enhance decision-making, increasingly driven by insights derived from this data. In a clinical environment, electronic health records (EHRs) are the cornerstone for developing information extraction strategies. This proposal aims to design and integrate novel, scalable algorithms supported by databases and artificial intelligence techniques to harness the potential of large EHR datasets and clinical data repositories, yielding valuable insights for decision-making. Data communication via federated learning will also be addressed to ensure privacy-preserving and security. The size and complexity of EHR databases offer significant challenges when they need to be processed in terms of applying analysis techniques and supporting the development of subsequent applications for practical tools. However, it also embodies many opportunities to create algorithms and methods able to display smart and relevant information related to either a particular patient or groups of patients and to boost the EHR into a more effective platform to support the healthcare professionals, coping medical applications and strategic government decisions with the demands and benefits of Big Data. In this project, we aim to deal with the challenges of managing and integrating not only the information, but also the knowledge from multiple modalities of health data. We will develop methods and algorithms that will ultimately be materialized in a modular platform to be made available to the area community.
Today, almost every human activity generates and/or demands to store and process massive, diverse and complex data, either in scientific, academic, enterprise and even leisure pursuits - the scenario being called as the big data era. Health-related activities are in the core of those activities, as they produce big data as well as they can take advantage of the technological storm, improving the behavior of everyone whose decision is increasingly guided by the information extracted from all these big data. In a clinical environment, the Electronic Health Records (EHR) forms a proper anchor to develop information extraction strategies. In this proposal, we aim at integrating novel database support, image processing and visual analytics methods to leverage the large number of EHR and repositories of clinical data to gather valuable and significant information for decision-making. The size and complexity of EHR databases offer great challenges when they need to be processed in terms both of applying analysis techniques and to support the development of subsequent applications for practical tools. However, it also embodies a cornucopia of opportunities to create algorithms and methods able to display smart and relevant information related to either a particular patient or groups of patients and to boost the EHR into a more effective platform to support the healthcare professionals, coping medical applications and strategic government decisions with the demands and benefits of big data. In this project we will develop methods and algorithms that will ultimately be materialized as a modular platform to be made available to the community.
The so-called Web-scale (or planetary-scale) graphs comprise millions of vertices and billions of edges. Such graphs have appeared in several contemporaneous contexts containing information that can potentially explain social behavior (Twitter and Facebook), commercial activities (Amazon), system structures (like roads and computer networks), non-structured information (Wikipedia), information organization (hypertext), to name a few. These graphs are of great analytical value because, besides having a wide range of information, the current trend is that more of such datasets will appear in the following years. For this reason, it becomes necessary the development and the mastering of techniques capable of working with such volumes of information. In this work, we propose to use asynchronous parallel processing of graphs combined with multi-resolution projection techniques applied over adjacency matrices to process and to visually represent Web-scale graphs. The work will based on system GraphChi within the goals of developing analytic-visual techniques that do not demand computational clusters, but, instead, turn the visualization of large graphs accessible to commercial systems with a single processing node.
Este projeto trata da incorporação de recursos para recuperação de dados por similaridade em SGBD Relacionais, desenvolvendo técnicas básicas que cubram as principais necessidades dos quatro módulos principais de um SGBD, atendendo às necessidades de armazenagem, recuperação e análise de dados complexos por similaridade de maneira integrada à armazenagem e recuperação de dados escalares, incluindo: - A integração da representação de consultas por similaridade em uma extensão da linguagem SQL; - A definição unificada dos operadores algébricos por similaridade segundo a teoria relacional, como operadores interoperáveis com os tradicionais e a representação interna das consultas atendendo a Álgebra Relacional; - O desenvolvimento de técnicas para otimização lógica e física dos planos de execução de consultas; e - O desenvolvimento de técnicas para indexação e recuperação eficiente em combinações de operações de busca por similaridade, por identidade e por ROT.
A proposta deste projeto consiste em promover a aproximação dos sistemas de recuperação de imagens por conteúdo (CBIR) à realidade médica e explorar sua capacidade em Sistemas de Auxílio ao Diagnóstico (Computer-Aided Diagnosis) por imagens integrando essas duas novas abordagens: percepção do especialista e perfil do usuário no processo de recuperação e de mineração de imagens médicas. Para isso, serão disponibilizadas aos sistemas CBIR técnicas e ferramentas que permitam incorporar a perspectiva de análise de imagens e dados do ponto de vista do conhecimento do especialista, diminuindo o gap semântico. A inclusão da percepção do especialista e dos perfis dos usuários na construção de ferramentas CBIR irá aproximar essa tecnologia do especialista médico, quebrando a barreira entre a ciência médica e a ciência da computação
O aquecimento global e suas conseqüências trazem novos desafios para os pesquisadores do Século XXI. Apesar da comunidade científica não ter dúvidas sobre o aquecimento do planeta, é premente a identificação das causas do aumento da temperatura média global, bem como a quantificação desse aquecimento e suas consequências para os ecossistemas. Modelos matemáticos e estatísticos têm sido empregados para analisar os possíveis cenários futuros e consequentemente uma grande quantidade de dados tem sido gerada. Além disso, o avanço tecnológico tem propiciado melhorias nos diversos sensores utilizados para medições de dados climáticos e de imageamento da superfície terrestre, contribuindo para o aumento na quantidade e complexidade dos dados gerados. As pesquisas envolvendo grande volume e diversidade de dados remete a dois dos Grandes Desafios da Computação: a gestão da informação em grandes volumes de dados e a modelagem computacional de sistemas complexos. Neste contexto, este projeto de pesquisa propõe investigar e desenvolver técnicas e métodos computacionais para analisar os conjuntos de dados complexos utilizados por meteorologistas e agrometeorologistas, para auxiliá-los nas pesquisas sobre os impactos das mudanças climáticas na agricultura brasileira. Em linhas gerais, o objetivo deste projeto é desenvolver métodos para analisar os resultados dos modelos regionais de prognóstico de mudanças climáticas e compará-los com medidas reais coletadas pelas estações de superfície, a fim de avaliar a qualidade dos dados gerados e dar subsídios para a calibração dos modelos de previsão. Adicionalmente, pretende-se desenvolver novos métodos para filtrar, analisar e extrair padrões da associação entre dados climáticos e dados extraídos de sensores remotos para auxiliar nas pesquisas agrícolas. O projeto embasa-se na parceria de pesquisadores do Grupo de Bases de Dados e Imagens (GBdI) do ICMC-USP, da Embrapa Informática Agropecuária, do Centro de Pesquisas Meteorológicas e Climáticas Aplicadas à Agricultura (Cepagri) da Unicamp, e do Departamento de Computação e Unidade de Sorocaba da UFSCar. Como referencial de pesquisa, propõe-se a Mineração de Dados e a Teoria dos Fractais associadas a técnicas de Visualização da Informação. Os resultados esperados no projeto irão contribuir para o avanço no estado da arte em mineração de dados, com reflexos na área de agrometeorologia, e para melhorias nas saídas dos modelos regionais de previsão de mudanças climáticas.