PDF Archive

Easily share your PDF documents with your contacts, on the Web and Social Networks.

Share a file Manage my documents Convert Recover PDF Search Help Contact



Extract pages from Libro Gasparini Cicowiez Sosa Escudero .pdf


Original filename: Extract pages from Libro Gasparini Cicowiez Sosa-Escudero.pdf
Author: martin

This PDF 1.7 document has been generated by / Foxit PhantomPDF - Foxit Corporation, and has been sent on pdf-archive.com on 01/06/2016 at 20:11, from IP address 191.98.x.x. The current document download page has been viewed 977 times.
File size: 352 KB (18 pages).
Privacy: public file




Download original PDF file









Document preview


APÉNDICE I

UN BREVE CURSO DE STATA
A.I.1. Introducción
A.I.2. La interfaz
A.I.3. Algunos comandos básicos
A.I.4. Archivos do y archivos log
A.I.5. Macros, escalares y matrices
A.I.6. Bucles
A.I.7. Condiciones if-then-else

A.I.1 Introducción
En este apéndice se introduce el software Stata, un paquete estadístico-econométrico que
puede utilizarse para manipulación de datos, econometría, gráficos y programación, entre
otras aplicaciones.1 Ciertamente, estas páginas no reemplazan a la documentación más detallada del Stata. Sin embargo, sirven para introducir al lector en los comandos básicos que
utilizan las aplicaciones que se describen en los distintos apéndices prácticos del libro. En
la actualidad existen dos paquetes de comandos que permiten ampliar la funcionalidad del
Stata para realizar distintos tipos de análisis distributivos: el DASP (Distributive Analysis
Stata Package) desarrollado en la Universidad Laval de Canadá (http://dasp.ecn.ulaval.ca),
y el ADePT (Stata Software Platform for Automated Economic Analysis) desarrollado en el
Banco Mundial (http://www.worldbank.org/adept). Si bien dichas aplicaciones pueden resultar de mucha utilidad, creemos que no brindan la flexibilidad suficiente que puede requerir
la solución de problemas particulares. Por ese motivo, en este libro mostramos cómo pueden
replicarse los distintos gráficos y tablas del texto empleando el Stata sin ningún paquete de
comandos adicional.
A modo de ejemplo, en este apéndice se utilizan algunas variables construidas por nosotros a partir de la información en crudo de la Encuesta Continua de Hogares (ECH) de
2005 de Bolivia. El archivo correspondiente, en formato CSV, se encuentra disponible en el
sitio web del libro. En lo que sigue se asume que el lector instaló el software Stata al mismo
tiempo que tiene acceso al contenido disponible en el sitio web del libro.2 En los distintos
capítulos del libro utilizamos el Stata para manipular diversas encuestas de hogares de países
de América Latina, realizar un análisis descriptivo de microdatos, presentar algunos gráficos
sobre la distribución del ingreso y calcular índices de pobreza y desigualdad, entre otras aplicaciones. Además, en varios capítulos se abordan tópicos algo más avanzados de programación como estructuras de control del flujo un programa (i.e., alternativas para la realización
de bucles y condiciones if-then-else), siempre con aplicaciones al trabajo con microdatos de
encuestas de hogares.
A fin de facilitar el trabajo con Stata, se sugiere configurar Windows para utilizar la coma
(,) como separador de miles y el punto (.) como separador decimal. Esto resulta particularmente útil cuando se importan datos a Stata; por ejemplo, desde Excel, Access o SPSS.

1
En http://www.stata.com puede consultarse gran cantidad de información sobre Stata. Adicionalmente, en los siguientes sitios web
pueden encontrarse tutoriales que enseñan cómo manejar Stata: UNC STATA Tutorial (http://www.cpc.unc.edu/services/computer/
presentations/statatutorial), y UCLA STATA Tutorial (http://www.ats.ucla.edu/stat/stata). En cualquier caso, es recomendable familiarizarse con el Stata mediante la lectura de la guía del usuario.
2
Idealmente, en su versión 11 o posterior. Como complemento del Stata, es útil utilizar un editor de texto para escribir nuestros
“programas” (ver más abajo).



Apéndice I: Un breve curso de Stata / 697

A.I.2. La interfaz
La interfaz de Stata está formada por cuatro ventanas: Review, Variables, Results y Command (ver figura A.1).
Figura A.1
La interfaz de Stata

El Stata puede utilizarse mediante menús y cuadros de diálogo. Sin embargo, la forma
de trabajar que proponemos en el libro es mediante la utilización de la línea de comandos
(ver ventana Command); es decir, escribiendo cada comando que queremos ejecutar. Como
veremos, las instrucciones o sentencias pueden introducirse de forma inmediata a través de
la ventana Command como así también a través de archivos de texto plano que Stata ejecuta
de manera secuencial (archivos do). Los resultados que Stata muestra en la ventana Results
pueden almacenarse, fácilmente, en un archivo de texto (archivos log). Los archivos do y log
se tratan más adelante en este apéndice.

La sintaxis del lenguaje
Con muy pocas excepciones, la sintaxis básica del lenguaje que utiliza Stata para sus
comandos es

698 / Pobreza y Desigualdad en América Latina

donde los corchetes indican que se trata de una parte opcional. Cabe resaltar que la ayuda
incluida en Stata explica qué parte de esta sintaxis acepta cada comando, ver opción Help del
menú superior.

A.I.3. Algunos comandos básicos
En este apartado se presentan los comandos más básicos que se requieren para implementar los apéndices prácticos del libro. En primer lugar, el lector puede escribir una por una las
instrucciones que se muestran a continuación en la línea de comandos. Luego, veremos cómo
incluirlos en un archivo do que nos permitirá replicar nuestro propio trabajo fácilmente.
En general, antes de abrir una base de datos es recomendable “limpiar” la memoria de
Stata. Para ello, puede utilizarse el comando

Por defecto, Stata 11 viene configurado para trabajar con bases de datos de hasta 50 MB3;
para llevar el tamaño de la memoria RAM asignada a la base de datos a 100 MB, debe utilizarse el comando

Cabe aclarar que es fundamental que la base de datos tenga un tamaño inferior al de la
memoria asignada en una línea como la anterior. De hecho, es importante trabajar con una
computadora que permita almacenar en la memoria RAM la base de datos completa. Es decir,
no es conveniente utilizar Stata con bases de datos que tienen un tamaño superior a la memora RAM de la computadora que se está utilizando.
En general, utilizaremos el disco rígido para almacenar archivos. El comando cd (change
directory) se utiliza para indicar a Stata el “path” o ruta que utilizaremos para acceder a nuestros archivos. Así, asumiendo que guardaremos nuestros archivos en la carpeta C:\Data, la
sentencia cd que debe introducirse es

En muchos casos la base de datos que se desea utilizar se encuentra en un formato diferente del propio de Stata (es decir, archivos con formato “dta”). En particular, si la encuesta
de hogares que deseamos utilizar está en formato CSV (comma separated values), puede
utilizarse el siguiente comando para importarla al Stata.

3
En versiones anteriores, la cantidad de memoria asignada por defecto al almacenamiento de bases de datos era considerablemente
menor. Por otro lado, a partir del Stata 12 el manejo de la memoria necesaria para almacenar la base de datos es automático.



Apéndice I: Un breve curso de Stata / 699

donde bol05_resumida.csv es el nombre del archivo que utilizamos como ejemplo en
este apéndice. Por su parte, la opción comma le indica a Stata que el archivo de datos utiliza
la coma (,) para separar los elementos de una misma fila. Además, el comando insheet
anterior asume que dicho archivo se ubica en la carpeta especificada al escribir el comando
cd visto más arriba.
El comando save permite guardar una base de datos en el formato dta. Así, la base de
datos recién abierta podría guardarse mediante la instrucción

donde la opción replace reemplaza, en caso de que exista, el archivo con el mismo nombre
del que estamos guardando.4 En general, es recomendable trabajar con archivos en el formato
propio de Stata porque, además de abrirse más rápidamente, permiten almacenar información
adicional a la base de datos propiamente dicha.5 El comando use se utiliza para abrir una base
de datos con formato dta; por ejemplo,

donde la opción clear del comando use elimina todas las variables de la memoria antes
de cargar en memoria la base de datos bol05_ej. En caso de no incluirla, el comando se
ejecuta solo si la base de datos en memoria fue guardada con anterioridad.
En su versión más simple, el comando describe presenta información básica sobre la
base de datos en uso. En particular, muestra el número de observaciones junto con la lista
de variables, indicando del tipo de cada una de ellas (es decir, numérico o alfanumérico). El
comando, relativamente sencillo, se escribe como

El comando summarize presenta algunos estadísticos (media, desvío estándar, mínimo
máximo) para la variable que se indica, pudiendo indicarse más de una variable. El comando
summarize puede utilizarse con ponderadores, condición if, y algunas opciones bastante
útiles que se describen en la ayuda del Stata – ver comando help. En el primer ejemplo, se muestra información básica del ingreso per cápita familiar (ver variable ipcf). En
4

Como puede observase, no es necesario especificar la extensión del archivo dta para el archivo que queremos guardar.
Se deja como ejercicio para el lector consultar en la guía del usuario de Stata la utilización, entre otros, del comando label. En
pocas palabras, dicho comando permite agregar etiquetas o descripciones a los distintos elementos que forman una base de datos
de Stata.
5

700 / Pobreza y Desigualdad en América Latina

el segundo ejemplo, el comando summarize para la variable ipcf se invoca utilizando
ponderadores; es decir, se tiene en cuenta la cantidad de individuos que representa cada encuestado. Como veremos, en las encuestas de hogares disponibles en el sitio web del libro,
el factor de expansión se almacena en la variable pondera. En el tercer ejemplo se realiza un
summarize con ponderadores de la variable ipcf, solo para las observaciones que cumplen
la condición urbano==1. Cabe hacer notar que al comprobar una condición if se utiliza el
doble igual (==).

Las estadísticas que genera el comando summarize son computadas sobre las observaciones válidas; es decir, aquellos con valor distintos de “missing”.
El comando replace permite reemplazar valores en una variable que ya existe. Por
ejemplo, la primera línea del bloque de código a continuación divide por 1000 todas las observaciones de la variable ingreso total familiar (ver variable itf). El comando replace
también puede combinarse con condiciones if; así, el segundo ejemplo reemplaza por 0 la
variable hombre si, originalmente, la variable hombre era igual a 1. En el tercer ejemplo,
la variable ipcf se reemplaza por cero para las observaciones que cumplen con la condición
urbano distinto de la unidad6; es decir, para los individuos que habitan en áreas rurales. Por
último, el cuarto ejemplo reemplaza por 0 los ingresos per cápita familiares de los hombres
que habitan en áreas rurales.

donde no es necesario dejar espacios entre los operadores + (adición), - (resta), * (multiplicación), / (división), ^ (potenciación), etc. Las líneas de código siguientes ilustran la
utilización del comando generate, que puede abreviarse (al igual que muchos comandos
de Stata) con sus primeras tres letras (i.e., gen). La primera línea genera la variable edad2
como el cuadrado de la variable edad. La segunda línea genera la variable grupo igual a
missing para todas sus observaciones; en Stata, el missing se representa con un punto que
indica la ausencia de valor – por lo tanto, un valor missing es diferente de un valor cero.7
Por último, el valor de la nueva variable se reemplaza por 1 para los individuos que cumplen
6

Alternativamente, puede utilizarse ~= para hacer referencia a “distinto”.
De manera más general, Stata permite identificar 27 tipos de missing. Con un punto (.) se representa el caso por defecto. Las demás
clases de missing se representan con .a, .b, etc. Así, es posible asociar a cada tipo de missing un motivo diferente que explica la
ausencia de información; por ejemplo, encuesta individual no realizada, pregunta no se aplica, etc. En este libro solo utilizamos el
tipo de missing por defecto.

7



Apéndice I: Un breve curso de Stata / 701

con la condición if especificada en el comando replace. El signo & (ampersand) es el “Y”
lógico que permite combinar condiciones; en el ejemplo, el reemplazo se realiza para las
observaciones que cumplen con ambas condiciones. Por su parte, el “O” lógico se denota
con la barra vertical |.

El comando table permite realizar tabulados. Así, el primer ejemplo a continuación
muestra la cantidad de observaciones que pertenecen a cada una de las regiones que identifica la encuesta; es decir, se muestra la frecuencia de cada uno de los grupos que identifica
la variable region. El segundo ejemplo computa para cada región el ipcf promedio, utilizando ponderadores. La opción contents –abreviada con c− permite agregar columnas
a la tabla que se mostrará en pantalla; en nuestro caso, agregamos el ipcf promedio. En el
último ejemplo se muestra una tabla con dos columnas; ¿qué muestra la columna indicada
con freq?

En general, luego de ejecutar un comando, Stata almacena sus resultados, además de mostrarlos en pantalla. Por ejemplo, luego de un summarize, Stata guarda los siguientes resultados: el número de observaciones, la suma de la variable pondera, el promedio, la varianza,
el desvío estándar, el valor mínimo, el valor máximo y la suma. El comando return list
muestra cuáles son los resultados que almacena Stata luego de un comando tipo “r”. La tercera línea del bloque de código siguiente genera la variable ipcf_media como igual a la variable ipcf dividida por el ingreso promedio computado con el comando summarize; luego
de un summarize, en r(mean) se almacena el valor promedio. Por último, se renombra la
variable ipcf_media empleando el comando rename.

El comando drop puede utilizarse para (1) eliminar observaciones, o (2) eliminar variables. En el primer ejemplo se eliminan las observaciones con ipcf < 50. En el segundo
ejemplo se elimina la variable ii (ingreso individual). En el tercer ejemplo se eliminan todas
las variables de la base de datos.

702 / Pobreza y Desigualdad en América Latina

La sentencia sort permite ordenar la base de datos de manera ascendente de acuerdo
con una o más variables. Por su parte, la sentencia gsort permite ordenar la base de datos
por una o más variables de manera ascendente o descendente. Por ejemplo,

donde la primera instrucción ordena la base de datos primero según la variable id y luego
según la variable edad. Es decir, las observaciones se ordenan por código de hogar y dentro
de cada hogar según la edad de cada miembro. La segunda sentencia es similar pero el ordenamiento por edad se realiza de mayor a menor.
El prefijo “by lista-de-variables:” permite ejecutar el mismo comando sobre
cada uno de los grupos en que una determinada variable permite dividir la base de datos. Por
ejemplo, si la variable region toma los valores 1, 2 o 3, las observaciones de la base de
datos pueden dividirse en tres grupos según la región a la cual pertenecen. Luego, si queremos ejecutar la sentencia “summarize ipcf” para cada una de las regiones en que puede
dividirse Bolivia, haríamos

Como vemos, antes de utilizar el prefijo by es necesario que la base de datos esté correctamente ordenada. Alternativamente, podríamos escribir

A.I.4. Archivos do y archivos log
Los archivos do son archivos de texto plano que contienen sentencias de Stata que se
ejecutan de forma secuencial. Es posible editarlos con el editor de archivos do que contiene
Stata. Sin embargo, es aconsejable utilizar un editor de programación con más prestaciones,
aunque también puede emplearse el Bloc de Notas.8 En el sitio web del libro pueden encontrarse links a algunos editores de texto que recomendamos.

8



El Bloc de Notas es un editor de texto plano incluido en todas las versiones del sistema operativo Windows.

Apéndice I: Un breve curso de Stata / 703


Related documents


extract pages from libro gasparini cicowiez sosa escudero
optimizar una mandriva o una mageia instalada en un disco de estado s lido ssd 1
optimizar una mandriva o una mageia instalada en un disco de estado s lido ssd
2014 0784 laboratorio fundamento 2 2018 pr ctica 5
fighterpos malware de punto de ventas
fundamentos de programaci n c


Related keywords