Update usandoDawrinCore.md

This commit is contained in:
Eduardo Dalcin 2023-03-26 16:47:05 -03:00 committed by GitHub
parent 6aa86683cb
commit 0756c8aa01
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -38,10 +38,14 @@ Clicando em "download" da opção "Data as a DwC-A file" você irá salvar no se
Entendendo o arquivo "Darwin Core Archive" (DwC-A)
Como dito anteriormente, o arquivo DwC-A é um arquivo "ZIP", ou seja, um arquivo que contém, internamente, vários arquivos. Na figura abaixo você pode visualizar a estrutura básica do arquivo DwC-A:
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/livraria/usandoDwc/usandoDwc3.png)
Como pode ver, o arquivo DwC-A é composto de dois conjuntos de arquivos: arquivos com extensão "TXT" e arquivos com extensão "XML".
Os arquivos meta.xml e eml.xml são arquivos de "metadados" - são dados sobre o conjunto de dados (o arquivo eml.xml) e sobre os arquivos ".TXT" que contem os dados (o arquivo meta.xml). Os arquivos em formato "XML" são destinados a serem lidos e interpretados "por máquinas", ou seja, de forma automatizada por outros computadores. Assim sendo, não vamos detalhá-los aqui neste guia. Os arquivos "TXT", entretanto, são aqueles que contém os dados em si. Desta forma, vamos nos dedicar a estes.
Os arquivos ".TXT" contidos dentro do arquivo DwC-A são, na verdade, tabelas representadas no arquivo por linhas (os registros) e colunas (os atributos destes registros). No caso dos arquivos gerados automáticamente pelo IPT, as colunas estão separadas por tabulações. Desta forma, são arquivos conhecidos como arquivos "Tab Separated Values" (TSV), diferentes dos aquivos ".CSV", onde as colunas são separadas por vírgulas.
Os arquivos TXT
## Os arquivos TXT
O conjunto de arquivos TXT dentro do arquivo "ZIP" do DwC-A pode ser de dois tipos:
Um conjunto de arquivos sobre ocorrência