Procesamiento de Archivos CSV

March 12, 2019 | Author: Jessica Zaragoza Zamora | Category: Comma Separated Values, Quotation Mark, Computer File, Areas Of Computer Science, Computer Data
Share Embed Donate


Short Description

Download Procesamiento de Archivos CSV...

Description

Archivos CSV Son un tipo de documento que contiene un formato sencillo para representar datos en forma de una tabla. Sus siglas en ingles: C = Comma S = Separated V = Values Una característica es: * Las columnas se encuentran separadas por comas. * Las filas por saltos de línea. Este formato es muy sencillo, un ejemplo puede ser una hoja de calculo: A continuación se muestra otro ejemplo: 1990, Maria, 10231416, 4to semestre 1991, Mario, 10231516, 2do semestre En el caso de que se encuentren comas en el mismo texto, entonces, se utilizan las comillas dobles para citar la diferencia: "1990, Maria", "10231416, 4to semestre" "1991, Mario", "10231516, 2do semestre" Este tipo de ficheros utilizan un formato llamado RFC 4180 el cual da formato y tipo. Introducción El formato de valores separados por comas (CSV) se ha utilizado para el intercambio de Y la conversión de datos entre diferentes programas de hoja de cálculo para bastante Algún tiempo. Sorprendentemente, mientras que este formato es muy común, se ha Nunca fue formalmente documentados. Además, mientras que la IANA MIME Registro incluye un árbol de registro "Text / separados por tabuladores de valores" de tipo, t ipo, tipos MIME no han sido nunca Registrado con IANA para CSV. Al mismo tiempo, diversos programas y

Sistemas operativos han empezado a usar diferentes tipos MIME para este Formato. Este RFC documentos el formato de valores separados por comas (CSV) y los archivos de registros formalmente el "text / csv" tipo MIME para CSV De conformidad con el RFC 2048 [1]. 2. Definición del formato CSV Aunque existen diversas implementaciones de las especificaciones y de la CSV (por ej. [4], [5], [6] y [7]), no es formal Especificación en existencia, que permite una amplia variedad de La interpretación de archivos CSV. En esta sección los documentos que el formato Parece ser seguida por la mayoría de las implementaciones: 1. Cada registro se encuentra en una línea distinta, delimitado por una línea Pausa (CRLF). Por ejemplo: Aaa, bbb, ccc CRLF Zzz, yyy, xxx CRLF 2. El último registro en el archivo puede o no tener una fila interminable Romper. Por ejemplo: Aaa, bbb, ccc CRLF Zzz, yyy, xxx

3. Existe tal vez una línea de cabecera opcionales aparecen como la primera línea Del archivo con el mismo formato de registro de líneas normales. Este Cabecera contendrá los nombres correspondientes a los campos en el archivo Y debe contener el mismo número de campos como en las actas El resto del archivo (la presencia o ausencia de la línea de cabecera Deberá indicarse a través de la opción "cabecera" de este parámetro Tipo MIME). Por ejemplo: Field_name, field_name, field_name CRLF

Aaa, bbb, ccc CRLF Zzz, yyy, xxx CRLF Shafranovich Informativo [Página 2] RFC 4180 y Formato Común de tipos MIME de los ficheros CSV Octubre 2005 4. Dentro de la cabecera y de cada registro, puede haber una o más Campos, separados por comas. Cada línea debe contener los mismos Número de campos en todo el archivo. Los espacios se consideran parte De un campo y no debe ser ignorada. El último en el campo Registro no debe ser seguido de una coma. Por ejemplo: AAA, BBB, CCC 5. Cada campo puede o no se escribe entre comillas dobles (sin embargo Algunos programas, como Microsoft Excel, no utilice comillas dobles A todos). Si los campos no son cerrados con comillas dobles, y luego Comillas dobles puede no aparecer dentro de los campos. Por ejemplo:

"Aaa", "bbb", "ccc" CRLF Zzz, yyy, xxx 6. Los campos que contengan saltos de línea (CRLF), comillas dobles, y comas Deben escribirse entre comillas dobles. Por ejemplo: "Aaa", "b CRLF Bb "," ccc "CRLF Zzz, yyy, xxx 7. Si comillas dobles se usan para encerrar campos, entonces una doble cita Que aparecen dentro de un campo debe ser librado por el anterior con Otro doble cotización. Por ejemplo: "Aaa", "b" "bb", "ccc"

La gramática ABNF [2] aparece de la siguiente manera: File = [cabecera CRLF] * registro (CRLF acta) [CRLF] * Cabecera = nombre (nombre COMMA) * = Campo registro (COMMA campo) Name = campo Campo = (escapado y no escapó) DQUOTE escapado = * (TEXTDATA / COMMA / CR / LF / 2DQUOTE) DQUOTE No escapó = * TEXTDATA COMMA =% x2C CR =% x0D; según la sección 6,1 de RFC 2234 [2] Shafranovich Informativo [Página 3] RFC 4180 y Formato Común de tipos MIME de los ficheros CSV Octubre 2005 DQUOTE =% x22; según la sección 6,1 de RFC 2234 [2] LF =% x0A; según la sección 6,1 de RFC 2234 [2] CRLF = CR LF; según la sección 6,1 de RFC 2234 [2] TEXTDATA =% x20-21 y x23-2B% /% x2D-7E Y AQUÍ LES DEJO LA PAGINA PARA Q LA CHEQUEN TAMBIEN http://www.normes-internet.com/normes.php?rfc=rfc4180&lang=es

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF