Wednesday 18 October 2017

How to create a panel data in stata forex


Para perguntas rápidas, envie um email para dataprinceton. edu. Não há appts. Necessário durante as horas de caminhada. Nota: o laboratório DSS está aberto enquanto o Firestone estiver aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Os dados do Painel de introdução dos dados do painel, também chamados de dados longitudinais ou dados de série temporal, são dados em que vários casos (pessoas, empresas, países, etc.) foram observados em dois ou mais períodos. Um exemplo é o National Longitudinal Survey of Youth, onde uma amostra nacionalmente representativa de jovens foi pesquisada repetidamente ao longo de vários anos. Existem dois tipos de informações em dados de séries temporais transversais: as informações transversais refletidas nas diferenças entre os indivíduos e as séries temporais ou informações dentro do assunto refletidas nas mudanças nos assuntos ao longo do tempo. As técnicas de regressão de dados do painel permitem aproveitar esses diferentes tipos de informações. Embora seja possível usar técnicas de regressão múltipla comuns em dados de painel, eles podem não ser otimizados. As estimativas de coeficientes derivados da regressão podem estar sujeitas a um viés variável omitido - um problema que surge quando existe alguma variável ou variáveis ​​desconhecidas que não podem ser controladas para que afetem a variável dependente. Com os dados do painel, é possível controlar alguns tipos de variáveis ​​omitidas, mesmo sem observá-las, observando mudanças na variável dependente ao longo do tempo. Isso controla as variáveis ​​omitidas que diferem entre os casos, mas são constantes ao longo do tempo. Também é possível usar dados de painel para controlar variáveis ​​omitidas que variam ao longo do tempo, mas são constantes entre os casos. O uso de dados do painel no conjunto de dados do painel Stata A deve ter dados em n casos, em períodos de tempo t, para um total de observações n vezes t. Dados como este são ditos em forma longa. Em alguns casos, seus dados podem aparecer no que é chamado de forma ampla, com apenas uma observação por caso e variáveis ​​para cada valor diferente em cada período de tempo diferente. Para analisar dados como este no Stata usando comandos para análise de dados de painel, você precisa primeiro convertê-lo em forma longa. Isso pode ser feito usando o comando Stata reshape. Para obter ajuda na utilização de reformulação, consulte a ajuda online da Statas ou esta página da web. A Stata fornece uma série de ferramentas para analisar os dados do painel. Os comandos começam com o prefixo xt e incluem xtreg, xtprobit, xtsum e xttab - versões de dados do painel dos comandos familiares reg, probit, sum e tab. Para usar esses comandos, primeiro diga ao Stata que seu conjunto de dados é um dado de painel. Você precisa ter uma variável que identifique o elemento caso do seu painel (por exemplo, um identificador de país ou pessoa) e também uma variável de tempo que esteja no formato de data Stata. Para obter informações sobre os formatos variáveis ​​da data Statas, consulte os dados da Série de tempo na página Stata. Classifique seus dados pela variável do painel e, em seguida, pela variável de data dentro da variável do painel. Então você precisa emitir o comando tsset para identificar o painel e as variáveis ​​de data. Se a sua variável de painel for chamada de panelvar e sua variável de data for chamada de datevar, os comandos necessários são: Se você preferir usar menus, use o comando em Configurações da série de tempo da Estatística e Utilitários. Declare Data para ser Time Series. Modelos corrigidos, entre e efeitos aleatórios Regressão de efeitos corrigidos A regressão de efeitos fixos é o modelo a ser usado quando você deseja controlar variáveis ​​omitidas que diferem entre os casos, mas são constantes ao longo do tempo. Ele permite que você use as mudanças nas variáveis ​​ao longo do tempo para estimar os efeitos das variáveis ​​independentes em sua variável dependente e é a principal técnica utilizada para análise de dados de painel. O comando para uma regressão linear em dados de painel com efeitos fixos no Stata é xtreg com a opção fe, usada assim: Se você preferir usar os menus, o comando está em Estatística. Série temporal. Modelos lineares. Regressão linear. Isso equivale a gerar variáveis ​​dummy para cada um de seus casos e incluí-las em uma regressão linear padrão para controlar esses efeitos de caso fixos. Ele funciona melhor quando você tem relativamente menos casos e mais períodos de tempo, uma vez que cada variável dummy remove um grau de liberdade do seu modelo. Entre efeitos A regressão com efeitos entre os dois é o modelo a ser usado quando você deseja controlar as variáveis ​​omitidas que mudam ao longo do tempo, mas são constantes entre os casos. Ele permite que você use a variação entre casos para estimar o efeito das variáveis ​​independentes omitidas em sua variável dependente. O comando para uma regressão linear em dados de painel com os efeitos em Stata é xtreg com a opção be. Executar xtreg com entre efeitos é equivalente a tomar a média de cada variável para cada caso ao longo do tempo e executar uma regressão no conjunto de dados recolhido dos meios. Como isso resulta na perda de informações, entre os efeitos não são muito usados ​​na prática. Os pesquisadores que desejam analisar os efeitos do tempo sem considerar os efeitos do painel geralmente usarão um conjunto de variáveis ​​dummy do tempo, o que é o mesmo que os efeitos fixos de tempo de execução. O estimador entre efeitos é principalmente importante porque é usado para produzir o estimador de efeitos aleatórios. Efeitos aleatórios Se você tiver motivos para acreditar que algumas variáveis ​​omitidas podem ser constantes ao longo do tempo, mas variam entre os casos e outras podem ser corrigidas entre os casos, mas variam ao longo do tempo, você pode incluir ambos os tipos usando efeitos aleatórios. O estimador de efeitos aleatórios Statas é uma média ponderada dos efeitos fixos e entre os efeitos. O comando para uma regressão linear em dados de painel com efeitos aleatórios em Stata é xtreg com a opção re. Escolhendo entre efeitos corrigidos e aleatórios A maneira geralmente aceita de escolher entre efeitos fixos e aleatórios é executar um teste de Hausman. Estatisticamente, os efeitos fixos são sempre uma coisa razoável a fazer com os dados do painel (eles sempre dão resultados consistentes), mas eles podem não ser o modelo mais eficiente para executar. Os efeitos aleatórios darão melhores valores de P, uma vez que são um estimador mais eficiente, então você deve executar efeitos aleatórios se for justificadamente justificável fazê-lo. O teste Hausman verifica um modelo mais eficiente contra um modelo menos eficiente mas consistente para garantir que o modelo mais eficiente também ofereça resultados consistentes. Para executar um teste de Hausman comparando efeitos fixos com aleatórios em Stata, você precisa primeiro estimar o modelo de efeitos fixos, salvar os coeficientes para que você possa compará-los com os resultados do próximo modelo, estimar o modelo de efeitos aleatórios e, em seguida, fazer o comparação. O teste hausman testa a hipótese nula de que os coeficientes estimados pelo estimador de efeitos aleatórios eficientes são os mesmos estimados pelo estimador de efeitos fixos consistentes. Se eles são (valor P insignificante, Probchi2 maior do que 0,05), então é seguro usar efeitos aleatórios. Se você conseguir um valor P significativo, no entanto, você deve usar efeitos fixos. Leitura adicional entre estimadores de Stata Uma discussão comparando o estimador estimado com o estimador de efeitos aleatórios. Teste de heterocedasticidade e autocorrelação em nível de painel de Stata Inclui um comando escrito pelo usuário que realiza um teste simples para correlação em série. Introdução à Econometria por James H. Stock e Mark W. Watson, 2003 Este texto tem uma boa discussão sobre a teoria por trás da análise de dados do painel e foi usado na preparação desta página. Veja, em particular, o Capítulo 8, Regressão com dados do painel. Copie 2007 The Trustees da Princeton University. Todos os direitos reservados. Dataprinceton. edu NOTA: A informação é para a Universidade de Princeton. Não hesite em usar a documentação, mas não podemos responder perguntas fora de Princeton. Esta página foi atualizada pela última vez em: Stata: análise de dados e software estatístico Nicholas J. Cox, Universidade de Durham, Reino Unido Scott Merryman, USDA Tenho dados de painel. Um painel (país, empresa, pessoa, o que quer que seja) serve como um painel de referência. Como eu relaciono valores para outros painéis com esse painel de referência, digamos, como uma relação (esse valor de panelrsquos para este período) (valor de painel de referência para este período) Ou, como eu trabalho com uma única vez (1700, 1952, seja o que for) Como um tempo de referência 1. Identifique a variável de interesse e a referência Para consertar idéias, trabalharemos com um conjunto de dados do painel, que pode ser baixado do site da Stata:. Use stata-pressdatar14grunfeld, clear Este conjunto de dados inclui dados econômicos em 10 empresas anônimas por 20 anos, 1935ndash54. A estrutura do painel foi especificada com xtset. A variável de painel é empresa. E a variável de tempo é ano. Formalmente, definir a estrutura do painel usando xtset não é essencial para o que se segue, mas é uma boa idéia de qualquer maneira. A empresa designada 1 tem valor máximo ao longo deste período, então usaremos isso como empresa de referência para ilustrar a técnica e trabalharemos com valor para ilustração. Mais tarde, mostraremos como a mesma lógica Stata pode ser usada quando você quer trabalhar com um tempo de referência. Substantivamente, esse problema é diferente, mas a lógica do programa é idêntica. Selecionar os valores da empresa 1rsquos é fácil:. Gerar mvaleref mvalue se company 1 A conseqüência natural desse comando é colocar valores faltantes nas observações de mvalueref para outras empresas. 2. Distribua os valores referencersquos para outras observações. O próximo passo, e aquele que, à primeira vista, parece mais complicado, é espalhar esses valores para outras empresas. Deixe-nos imaginar os resultados de uma primeira ordem do ano e, em seguida, dentro do ano em mvalueref. Por exemplo, o primeiro valor do ano é 1935, e dentro de todos os valores de 1935, as 10 empresas seriam classificadas de acordo com o mvalueref. Agora, no máximo, um valor para mvalueref para 1935 será inexistente, o valor para a empresa 1, todos os outros estarão faltando, como acabamos de mencionar. O resultado de um tipo de valores numéricos é sempre colocar os valores faltantes em último lugar, depois de quaisquer valores inquestionáveis. Em suma, para cada ano. Qualquer valor não faltante sempre terminará como o primeiro valor. Podemos explorar esse fato para espalhar os valores do painel de referência para outros painéis:. Bysort year (mvalueref): replace mvalueref mvalueref1 Esta afirmação faz muito ao mesmo tempo, que pode ser descompactada da seguinte forma: classifique o ano e, em seguida, dentro do ano em mvalueref Para cada bloco de dados para cada ano. Substitua mvalueref com o primeiro valor que demora nesse bloco. (Sub por varlist:. Os índices como 1 são interpretados dentro de cada bloco, não com referência ao conjunto de dados como um todo.) Para mais informações sobre bysort. Veja os manuais ou o tutorial na Cox (2002). 3. Calcule a quantidade desejada Agora podemos calcular o que queremos, digamos,. Gerar mvaluesc mvaluemvalueref ou o logaritmo disso, ou uma diferença. 4. O que poderia dar errado com esta abordagem Este conjunto de dados de exemplo parece estar em excelente condição. Não há valores em falta no conjunto de dados, e está completo com todas as empresas representadas para todos os anos. Duas coisas geralmente dão errado com outros conjuntos de dados do painel. Em primeiro lugar, suponha que o valor fosse de fato desaparecido para 1935 e para a empresa 1. Então, todos os 10 valores de mvalueref nasceram em falta para 1935 e permaneceriam assim após a classificação e, em seguida, a substituição. Alguns valores em falta seriam classificados na primeira posição dentro de 1935 (não importa o que, como todos são idênticos), e uma falta seria substituída por uma falta. Isso parece justo. Em segundo lugar, suponha que mvalue para 1935 e a empresa 1 fossem de fato omitidos no conjunto de dados. Então, todos os nove valores de mvalueref para as empresas 2ndash10 nasceram em falta para 1935, e o resultado se assemelhará à da situação anterior, embora por uma razão diferente. Assim, os dois principais problemas têm consequências razoáveis ​​e não afetam as observações, exceto o ano a que se aplicam. 5. Como aplicamos essa abordagem a um tempo de referência. A mesma lógica Stata se aplica quando desejamos trabalhar com um tempo de referência. Suponha para este conjunto de dados que desejamos comparar valores com os de 1950. Primeiro, use somente os valores para 1950:. Gerar mvalueref mvalue se o ano de 1950 Então espalhe esse valor para as outras observações em cada painel:. Bysort company (mvalueref): substitua mvalueref mvalueref1 Você pode estar tentado a fazer algo como isto:. Por outro lado, esta abordagem depende do fato de que o conjunto de dados em questão é um painel equilibrado, no qual cada empresa é observada para todos os anos de 1935 a 1954. Assim, quando cada painel está em ordem de ano, o valor Para 1950 é o 16 em cada painel. A solução funciona para este exemplo, e soluções similares funcionarão sempre que você tiver painéis equilibrados, mas não é um bom estilo. Primeiro, em um arquivo de log, o código acima pode não ser transparente a menos que você adicione um comentário, uma vez que a implicação de usar a observação 16 pode não ser óbvia em uma leitura posterior. Em segundo lugar, e mais importante, esta solução não é transferida para painéis não desequilibrados. 6. Uma abordagem egen Aqui está outra maneira de fazê-lo. De certa forma, é uma técnica pior, mas, de outras maneiras, mostra mais do poder da Stata. . Bysort company: egen mvalueref total (cond (ano 1950, mvalue.)) A expressão cond (ano 1950, mvalue.) Usa o valor para mvalue quando o ano é 1950 e falta em contrário. Quando executado através de egen, total () sob a égide do painel:. O valor de 1950 é aplicado a cada observação em cada painel. Egen, total () ignora missings em seu cálculo, de modo que o total é idêntico ao valor de 1950. Mais uma vez, pense no que pode dar errado. Se mvalue estivesse faltando para 1950 em qualquer painel, então o total também faltaria para esse painel. Se não houvesse observação para 1950 em qualquer painel, então o total de todos os outros valores nesse painel seria calculado. Em ambos os casos, a falta seria retornada como resultado do painel, como seria justo. Esta abordagem não é equivalente a. Bysort company: egen mvalueref total (mvalue) se o ano de 1950, porque isso deixa as faltas em quase todos os lugares e não é absolutamente nenhum ganho (e, de fato, é menos eficiente do que). Gen mvalueref mvalue se o ano 1950 Outros exemplos de uso de egen em problemas de painel são dadas em outras FAQs: Em várias versões antes de Stata 9, egen, total () foi chamado egen, sum (). Se você deseja saber mais sobre cond (). Veja o tutorial de Kantor e Cox (2005). Para uma discussão mais geral sobre as comparações nos conjuntos de dados, veja Cox (2017). Referências Cox, N. J. 2002. Speaking Stata: Como mover passo por: passo. Stata Journal 2: 86ndash102. Kantor, D. e N. J. Cox. 2005. Dependendo das condições: Um tutorial sobre a função cond (). Stata Journal 5: 413ndash420. Cox, N. J. 2017. Speating Stata: Comparado com. Stata Journal 11: 305ndash314.

No comments:

Post a Comment