Update 20220820-discutindoRelacao.md

This commit is contained in:
Eduardo Dalcin 2023-03-22 08:41:35 -03:00 committed by GitHub
parent 45557a2a47
commit 94d8fddda0
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -1,7 +1,7 @@
# Discutindo a Relação
## 20 de Agosto de 2022
discutindoRelacao1.jpg
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao1.jpg)
Quem trabalha no “domínio” da biodiversidade tem a clara percepção de que ela é “transversal” a tudo. A manifestação da biodiversidade está presente nas questões sociais, saúde, cultura, direitos e cidadania, ciência, tecnologia, educação e economia, cobrindo todos os “eixos temáticos”.
@ -17,11 +17,11 @@ Em 2000, lendo este artigo, percebi que meu desconforto com os SGBDs relacionais
Sem querer ser muito técnico, que não é esse o foco aqui, relações são representadas (e recuperadas) em bancos de dados relacionais através de um “JOIN“. Além de não ser exatamente “simples”, possui um custo computacional altíssimo, há muito tempo conhecido e temido. Quanto mais “JOINs” na consulta, para representar relações, mais “lento” fica o sistema. Simples assim. Não vou sequer entrar na questão da “escalabilidade horizontal” de bancos de dados SQL, pois é outro fator limitante.
discutindoRelacao2.jpg
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao2.jpg)
Pois bem, tudo isso ai em cima é para chegar neste ponto onde quero declarar explicitamente minha nova “paixão” (deixando claro para minha doce Claudia, “paixão profissional!”). Depois de muito adiar, aproveitando essa pandemia, dediquei parte do meu tempo a estudar os bancos de dados orientados a grafos na desconfiança de que eles seriam uma abordagem interessante para lidar com esta complexidade de relações da biodiversidade, em suas diferentes camadas. Cada vez mais, me convenço disto.
discutindoRelacao3.png
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao3.png)
Há alguns anos eu havia me interessado pelas visualizações de redes e comecei a “brincar” com o Gephi. Avancei em alguns projetos, mas o único que acabou publicado foi este aqui, do qual muito me orgulho, pois foi citado pela CBD como exemplo de análise a ser seguido por outros países. Porém, em algumas visualizações / análises percebi que o Gephi estava me limitando na sua capacidade de processar volumes consideráveis de nós e relações. Foi aí que os bancos de dados orientados a grafos ganharam minha atenção. Especialmente o Neo4j.
@ -31,18 +31,18 @@ Esta postagem já está ficando longa. Vou tentar ir direto ao ponto, de modo be
* “Grafo” é uma abstração matemática, baseada na teoria dos grafos, cuja estrutura é representada por “nós” (vértices) e a relação entre eles (aresta);
* Tanto nós quanto as arestas possuem propriedades, e arestas possuem uma direção.
discutindoRelacao4.png
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao4.png)
BDOGs são utilizados quando as relações são mais importantes do que as entidades. Ele é ótimo para análises exploratórias na identificação de padrões baseados em relações complexas:
discutindoRelacao5.png
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao5.png)
_Tipos de bancos de dados com seus exemplos, nas diferentes complexidades dos dados._
_Fonte: Bechberger, D., & Perryman, J. (2020). Graph Databases in Action. Manning Publications._
É importante perceber que a popularidade dos BDOGs tem crescido bastante, inflamada pelas redes sociais, navegação e compras na Internet:
discutindoRelacao6.png
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao6.png)
_Fonte: https://dmccreary.medium.com/enterprise-knowledge-graph-trends-for-2021-201cbd7ad532_
@ -50,12 +50,12 @@ Por conta disto, com muito material e ferramentas disponíveis, podemos nos apr
Ando implementando alguns bancos de dados orientados a grafos no Neo4j, com base em alguns conjuntos de dados que já tinha estruturado em bancos relacionais, por exemplo, para visualizar a “transmissão do conhecimento taxonômico” através da relação de orientação na pós-graduação de participantes da Flora e Funga do Brasil, assim como a competência destes taxonomistas em relação ao taxa:
discutindoRelacao7.png
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao7.png)
_Esta figura representa a “transmissão de conhecimento” com origem na Dra Ana Maria Giulietti Harley, em uma relação de formação na pós-graduação com um total de 70 taxonomistas, em 50 orientações de mestrado e 42 orientações de doutorado, considerando apenas os taxonomistas envolvidos com a Flora e Funga do Brasil. (base total: 1.576 nós e 1.814 relações)_
_clique para ampliar_
discutindoRelacao8.png
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/BiodivDadosMeta/discutindoRelacao8.png)
_Relação de competência do taxonomista com o taxa (base total: 14.085 nós e 7.388 relações)_