mirror of
https://gitserver.jbrj.gov.br/edalcin/livraria.git
synced 2024-05-15 06:32:49 -03:00
Update usandoDawrinCore.md
This commit is contained in:
parent
6aa86683cb
commit
0756c8aa01
@ -38,10 +38,14 @@ Clicando em "download" da opção "Data as a DwC-A file" você irá salvar no se
|
||||
Entendendo o arquivo "Darwin Core Archive" (DwC-A)
|
||||
Como dito anteriormente, o arquivo DwC-A é um arquivo "ZIP", ou seja, um arquivo que contém, internamente, vários arquivos. Na figura abaixo você pode visualizar a estrutura básica do arquivo DwC-A:
|
||||
|
||||
![](http://dalcinweb.s3-website-us-east-1.amazonaws.com/github/livraria/usandoDwc/usandoDwc3.png)
|
||||
|
||||
Como pode ver, o arquivo DwC-A é composto de dois conjuntos de arquivos: arquivos com extensão "TXT" e arquivos com extensão "XML".
|
||||
Os arquivos meta.xml e eml.xml são arquivos de "metadados" - são dados sobre o conjunto de dados (o arquivo eml.xml) e sobre os arquivos ".TXT" que contem os dados (o arquivo meta.xml). Os arquivos em formato "XML" são destinados a serem lidos e interpretados "por máquinas", ou seja, de forma automatizada por outros computadores. Assim sendo, não vamos detalhá-los aqui neste guia. Os arquivos "TXT", entretanto, são aqueles que contém os dados em si. Desta forma, vamos nos dedicar a estes.
|
||||
Os arquivos ".TXT" contidos dentro do arquivo DwC-A são, na verdade, tabelas representadas no arquivo por linhas (os registros) e colunas (os atributos destes registros). No caso dos arquivos gerados automáticamente pelo IPT, as colunas estão separadas por tabulações. Desta forma, são arquivos conhecidos como arquivos "Tab Separated Values" (TSV), diferentes dos aquivos ".CSV", onde as colunas são separadas por vírgulas.
|
||||
Os arquivos TXT
|
||||
|
||||
## Os arquivos TXT
|
||||
|
||||
O conjunto de arquivos TXT dentro do arquivo "ZIP" do DwC-A pode ser de dois tipos:
|
||||
|
||||
Um conjunto de arquivos sobre ocorrência
|
||||
|
Loading…
Reference in New Issue
Block a user