Corpus de texto
Por temas técnicos, hasta el momento nuestro trabajo está limitado a un corpus, es decir un conjunto de textos escritos. Pueden ser escritos a mano o por máquina o cualquier otro medio, pero tienen que presentar una semántica estructurada.
Por lo tanto, se debe excluir el concepto de texto en su sentido amplio, donde se usa a veces para cualquier fuente del pasado, incluyendo metatextos, material visiual o artefactos.
Esto exluye también fuentes como:
Datos de fuentes primarias
Según Wikipedia:
Una fuente primaria se refiere a las fuentes documentales
que se consideran material proveniente de alguna fuente del momento, en
relación a un fenómeno o suceso que puede tener interés en ser
investigado o relatado, es decir, es la materia prima que se tiene para
realizar un determinado trabajo de investigación.
También hay fuentes de información primarias llamadas inéditas,
que no se encuentran al acceso público o de circulación restringida como
las tesis o los informes.
Para nuestro caso concreto lo está incluso especificando más:
En el caso de la historiografía, es lo que en su momento ha servido para escribir la historia.
En efecto, en el origen del desarrollo de la historiografía, se
encuentra la cuestión de la clasificación y la validación de las
fuentes, cuando los historiadores analizaron y discutían sobre la
escritura de la historia y de la prehistoria, y sobre la manera en que los conocimientos del pasado eran obtenidos aplicando la metodología de la historia. También se dividen en fuentes escritas y no escritas.
En resumen. Las fuentes primarias, son aquellos datos que se han creado en la época histórica que estamos analizando.
Por ejemplo, todos los textos creados entre año 1800 y el año 1900 serían fuentes primarias, si la época que desamos analizar es el siglo XIX, hayan sido publicados o no. En cambio, si el objeto de nuestra investigación es la época del siglo X. Aquellos textos textos del siglo XIX serían una fuente secundaria.
O en otras palabras, si la persona que ha escrito el documento ha vivido al mismo tiempo que lo occurido que está describiendo, entonces es una fuente primaria, aunque describa algo que no haya vivido en primero persona, como por ejemplo un artículo de la policía sobre un accidente.
Ejemplos para fuentes primarias admisibles son:
Se pueden incluir grabaciones de audio, siempre y cuando se hayan transcritos a texto. Fuentes audivisuales no son admisible, ni siquiera cuando tengan una transcripción, debido a la problemática de que la parte visual no puede ser analizada con el presente método.
Datos auténticos
Estos datos provienen de fuentes auténticas. Estos abarcan todo el material producido en primera persona. Es decir, la persona que redacta el texto, no solo escribe sobre un succeso contemporáneo, sin también sobre sí mismo y lo que concierne su vida de forma directa.
Esto excluye por ejemplo biografías por contemporáneos, informes de autoridades o noticias de periódicos.
Ejemplos para fuentes primarias auténticas son:
- Autobiografías
- Cartas
- Discursos
- Opiniones y pamphletos escritos por la persona en cuestión
- Contratos
- Escrituras
Material autobiográfico
Para limitar aún con más precisión el material con el cual se trabaja, en este proyecto nos limitamos a material autobiográfico. En pocas palabras, estos son todos los textos de fuentes primarias auténticas que expresan o describen una parte de la vida de su autor.