Pular para o conteúdo

O Carnaval do DBA

O Carnaval do DBA

Salve Galera.. Tudo bem com vocês??

Desculpem pela demora em postar algo.. eh q esta semana é carnaval neh..!!!
Bom, queria vir aqui cantar uma marchinha de carnaval.. tipo.. “alalaoooo oohohohhhhh.. mas que calor.. ohooo ohhoooooo!”, mas a música que eu cantei esta semana foi.. “Alalaooooo ohoohohoooo.. o banco crashouuu oohooo ohohoooo”..

Eh pessoal, vou fazer um relato de como foi minha semana.. alias.. q semana..

Eu acredito que os responsáveis pela ADM do prédio onde trabalho contrataram um ex-funcionário de angra dos reis.. e ai sabado de carnaval ele viu uma placa na porta do andar.. “O ultimo que sair, desligue tudo”.. é.. ele realmente fez isto.. novamente… e desligou o ar-condicionado do DataCenter.. então imagina.. DataCenter, cheio de servidores.. storage e tal.. sem ar-condicionado.. eh.. foi bem isto q aconteceu.. fez mais calor lá que no Rio de Janeiro.. e conclusão.. máquinas desligadas.. e quando voltaram as bases.. eh.. quando tentaram voltar as bases.. descobrimos que 7 servidores haviam corrompido suas bases.. Ai começa meu martirio.. focando na primeira base.. startado base em modo mount.. verificado arquivos corrompidos.. apenas 1 datafile com problemas.. sussa.. recover datafile X.. recover completo.. banco no ar.. eh.. isto funcionou para 6 bases.. e como Murphy nos ama.. logo a base mais importante não subiu.. total de 78 datafiles corrompidos.. ble.. volta backup dos datafiles.. kd o backup atual? o gato comeu.. de quando eh o ultimo backup.. bom.. de 15 dias atras.. q coisa não.. ble.. volta backup dos datafiles.. kd os archives? ta na fita.. então bora tirar.. opa.. a ferramenta de backup não funciona.. oq? como assim? eh.. não funciona.. bora arrumar primeiro a ferramenta de backup.. opa.. conseguimos baixar archives.. até 5 dias antes do problema.. ainda faltam 5 dias de archive.. bora terminar de baixar..!!

Eh novamente Murphy e a ferramenta de backup novamente não le a fita.. e nesta briga ja foram 3 dias sem dormir.. opa.. finalmente os archives foram baixados.. um total de 1400 archives..
Agora é começar a aplicar.. e isto já eh terça de carnaval..
Eh iniciado a aplicação dos archives, tempo estimado de termino.. 9 horas.. um dia inteiro de aplicação.. bom.. ta acabando.. q felicidade.. !!!! Iuuuupiiiiiiiiiiiiiiii… ta acabandooo..!!!!
1397.. foi… 1398… foooooiiiiii… mais 2.. mais 2.. mais 2…. 1399.. opaaaaaaaaaaaaaa.. vamos la… todos estes dias de trabalho e ta acabando.. q emoção.. q emoção..!!!
1400… opaaaaaaa.. vai.. vai.. vai.. vaaaaaaaaaaaaaaaaaiiiii…..

eh.. isto ai.. na aplicação do ultimo archive.. erro ora-00600… sabe oq eh desespero? bom.. foi oq senti neste momento.. ja estava preparando a festa para comemorar.. mas alegria de DBA dura pouco..

La vou correndo para o metalink.. alias.. Marcão.. valeu mano.. valeu pela ajuda em me mandar os links do MetaLink..
Não havia nada q ajudasse no metalink.. abrir chamado para a oracle.. tempo de resposta.. só eles sabem.. então.. Plano B..

Agora qual o plano B.. bom. plano B é o DBA se F#@#!@# pois agora tem q fazer restore de toda a base.. e ai.. fazer backup da base atual do jeito q esta.. hum.. tem tempo? não.. deleta tudo.. oq? eh.. deleta.. ble..!! apagar cerca de 1.2TB.. ah eh.. esqueci de falar.. esta base tem mais de 1TB.. Então.. voltar backup.. ble.. manda voltar..
Vai demorar quanto tempo? 12 hras..

15 hras depois.. e ai.. ja? ta estranho.. não ta voltando mais nada.. putz… oq? como q é? eh.. a ferramenta de backup não ta tirando da fita.. bora arruma esta “bendita” ferramenta.. oq não voltou? anhnn… cerca de 160 datafiles.. ble.. manda voltar só estes.. ok.. iniciado retirada da fita…. e até ai.. ja estamos na quinta-feira de madrugada.. .
Agora vamos aos procedimentos para verificar quantos archives preciso baixar…

Select * from v$recovery_log; — esta view informa quais os archives vc precisa aplicar na sua base para restaura-la até o ultimo checkpoint que consta no banco..
Select * from v$datafile_header; — esta view mostra as informações sobre os datafiles a serem recuperados..
Select * from v$recover_file; — esta view mostra os datafiles e tem um campo time onde mostra a data que consta do ultimo checkpoint de cada datafile a ser restaurado..

Q coisa estranha.. consta que 80% dos datafiles estão com data de 17/01.. ah.. culpa adivinha de quem? Da ferramenta de backup que restaurou metade dos arquivos do ultimo backup valido e a outra metade do penultimo backup válido.. quantos archives eu preciso aplicar..

Select count(1) from v$recovery_log;

O resultado foi algo assim.. amedrontador.. cerca de 2500 archives para aplicar.. iniciado a aplicação de archive dia 19/02 às 12:00 horas.. ahh.. mas desta vez será um com ultil sequence.. não vou mais aplicar o bendito ultimo archive..

run {
set ultil sequence 2499;
restore database;
}

la se vai mais um dia.. sexta-feira o dia todo.. agora vou dormir (1 da manhã).. e as 2 da manhã.. o cel toca.. o coração dispara.. oq houve? algum problema? as lagrimas correndo pelo rosto.. =(
Ufa… não era problema.. só queriam saber em que archive estava.. la vai eu olhar.. bom.. aplicado cerca de 40% dos archives.. e quem disse q eu consegui dormr de novo.. heheeh..
7 hras da manhã.. la vai eu para o curso de SqlServer (ai.. não to traindo o oracle não heim.. eh q a função exige..)..

Inicio do curso.. 40 minutos depois.. o cel toca.. =D… iupiii… la vai eu correr para um local com wirelles.. bora acessar a empresa.. cerca de 90% ja aplicado.. opa.. agora bora as movimentações de archive.. pq mais de 2000 archives é pesado pakas.. e a área de archive tava abarrotada.. bora fazer gambiarra.. renomear a área de archive e criar outra..

Aguardando o termino da aplicação de archive.. e quando foi umas 2 da tarde.. faltavam 4 archives.. olha o coração batendo forte de novo.. o suor escorrendo pela testa.. as mãos tremulas.. a boca seca.. faltam 3.. faltam 3.. mais 1.. mais 1.. mais 1.. agora faltam 2…. as lagrimas correndo pelo rosto.. a aflição tomando conta.. falta 1.. .. falta 1.. o coração ta na garganta agora.. e a mensagem enfim aparece…

RECOVERY MEDIA COMPLETE!!!!

Eh uma alegria tremenda.. mas ainda falta abrir o banco.. engole a saliva.. um silencio no corredor da instituição onde curso.. as secretárias no telefone..

la vai o tão esperado comando….

alter database open resetlogs; — a opção resetlogs faz com que seu banco sofra uma nova incarnação.. isto mesmo.. incarnação.. digamos que ele tenha morrido e renascido em outro corpo.. tudo zera.. o proximo archive gerado terá sequence 1…

E a mensagem aparece…

Database Altered;

Lanço um sonoro e alto.. CARA#$@!!#$# TA NO AR!!!!!!!!!!!

Bom.. só que neste exato momento passa pela minha frente uma das secretárias da instituição.. coitada.. hauah.. hauha.. nunca vi alguem dar um pulo tão grande quanto ela.. naquele momento ela deve ter chigado até a ultima geração da minha familia.. huaha.. hauha..!!

Enfim.. 2:40 da tarde deste sabado (20/02) a base estava no ar e integra..

Gostaria de agradecer ao Portilho por tirar algumas dúvidas que eu tinha.. hhheehe.. como sempre me ajudando.. e agradecer a todos que tem me auxiliado nestas minhas empreitadas… Rodrigo Almeida que to sempre enchendo para tirar dúvidas e ao David Ricardo que é outro que sofre com minhas perguntas.. hauh.. hauah.. Abraços manos.. !! E bora marcar um dia para tomar aquela gelada..!!

Bom pessoal.. fiz um relato bem curto de como foi minha semana de carnaval.. e quando o banco ficou no ar.. ufa.. senti como se um peso tivesse saido das minhas costas.. cheguei em casa por volta das 17 hras e apaguei.. acordei as 22 hras.. estava precisando.. caraca.. mas valeu a pena.. aprendi muito nesta semana… e uma coisa que é deveras importante em nossa carreira.. backup.. algo que meu Diretor falou.. “Em uma empresa muitas vezes não importa a base de produção, ou outra coisa.. muitas vezes o que importa realmente é o backup.”…

Que luta.. q luta.. mas foi vencida.. bom.. espero que tenha sido.. só iremos saber se a base realmente ta completa na segunda-feira quando o pessoal for utiliza-la.. ahh.. e sim.. eu ja mandei fazer backup FULL desta base.. e esta fazendo..!!!

Abraços galera.. espero que no proximo post eu fale de coisas melhoras.. não me adentrei muito aos detalhes do que foi feito pois ai o post teria mais de 100 partes.. foi trampo pra caramba.. coloquei aqui apenas o necessário..!!

Até a proxima..!!

Regis Araujo

Regis Araujo

Regis Araujo é DBA há 07 anos, especialista em Banco de Dados Oracle com experiência em SQL-Server e Bacharel em Ciências da Computação. Com conhecimentos em Banco de Dados e Sistemas operacionais.

Comentário(s) da Comunidade

  1. Opa.. Valeu Rodrigo..

    Mas é só rindo para não chorar.. Tem coisas que somente de maneira alegre conseguimos resolver.. pq a briga foi boa.. hehehe.. !!!

    Abraços e obrigado..!!

  2. “…Lanço um sonoro e alto.. CARA#$@!!#$# TA NO AR!!!!!!!!!!!….”

    Poucos momentos se comparam a esse do sonoro #%@*#& …
    Isso é muito bom …
    Parabéns Regis, menos um leão ….

    Abraços!!

  3. Cara!

    “CARA#$@!!#$# TA NO AR!!!!!!!!!!!”

    Quase chorei acompanhando o seu relato! Tô suando até agora, parecia que os problemas estavam no meu terminal! Que desgraceira, ein!

    Meu, parabéns por ter conseguido!
    Depois vc faz um post mais detalhado sobre a parte técnica, e sobre as PREVENÇÕES!

    Abçs,
    Lílian

  4. Salve Senhores e Senhorita..!

    Eh.. Só rindo para não chorar.. heheeh.. mas é bom quando se consegue resolver um problema assim.. nos da mais moral.. mas eu não quero passar por isto novamente por um bom tempo..!

    O Wagner, legal esta empresa, mas imagina quanto ficaria mais de 30TB de dados para fazer backup´s diários??? Então temos que recorrer a algum software de backup que pode e com certeza vai dar problemas..!

    Abraços e obrigado a todos pelos comentarios..!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

plugins premium WordPress