Sobre Carol Souza

Caroline de Souza Vieira, mais conhecida como Carol Souza, formada em Análise de Sistemas, administradora de redes Linux, incentivadora do uso de Software Livre e usuária OpenSuse. Membro atuante da Comunidade Software Livre no Rio de Janeiro, colaboradora voluntária de eventos como Hack’n Rio 2011, IV FSLDC e DFDRJ, blogueira em sites como Cotidiano Linux, Gmigos, Mulheres na Tecnologia e CooperaTI além de manter o próprio blog Carolinux. Sonhadora, amiga, determinada, criativa e movida à desafios. Uma “padawan” amante de tecnologia, aspirante a corredora, ritmista e blogueira.

Novo site!!

Galerinha, mudei de /home e agora vocês poderão me encontrar no endereço:

http://carolinux.com.br

Obrigada por todo o carinho de vocês e espero que gostem do novo blog.

Abraços. 😉

Lançamento da versão 12.1 do OpenSuse

Depois de 8 meses de espera quarta-feira é o lançamento do OpenSuse 12.1!

Mas antes de mostrar a nova versão, vou falar um pouco sobre as mudanças que ocorreram na estrutura numérica para as novas versões.

Foi aberta uma votação para que se decidisse sobre o novo método de numeração para as versões do OpenSuse, entre os estilos sugeridos temos os de algumas distros conhecidas como o Fedora (estilo de número inteiro como o Fedora 14 ou o Fedora 15), o Ubuntu (estilo em que o número da versão reflete a data de lançamento como o Ubuntu 11,04 para significar o Ubuntu lançado em abril de 2011) e o Mandriva (estilo que usa o ano como referência acrescido de uma sequência numérica, como Mandriva 2.010,2, ou seja, o segundo lançamento em 2010).

Com base na idéia de de manter números consecutivos, a sugestão eleita foi a “old school”, assim como já é adotado mas com a eliminação da versão 0.0 e liberação de novas versões a cada 3 meses.

Assim, os próximos quatro lançamentos serão:

Novembro 2011: openSUSE 12,1
Julho 2012: openSUSE 12,2
Março 2013: openSUSE 12,3
Novembro 2013: openSUSE 13,1

O resultado da votação pode ser visto aqui:
http://www.surveymonkey.com

Agora chega blá bla blá e vamos ao que interessa!!! \o/

Pra quem gosta, o OpenSuse virá com a versão 3.2 do GNOME, com grandes melhorias no Nautilus no que se trata de gerenciamento e pré-visualização de documentos. E para os que utilizam o KDE, como eu, vão poder desfrutar da versão 4.7. Outra alteração importante é a remoção do KPackageKit, simplificando assim a instalação de remoção de aplicativos. O projeto para Tablet ainda não fará parte da versão 21.1 mas a comunidade do KDE está trabalhando duro para disponibilizá-la na próxima release.
Nos outros WM existentes XFCE e LXDE, não houveram mudanças significativas, mas apenas melhorias.

Visualmente um sistema lindo, mas e por dentro?
-> O OpenSuse 12.1 promete inicializar mais rápido, com melhorias no gerenciamento de hardware e configuração do sistema.
-> A inicialização agora é gerenciada pelo systemd (para os apreciadores do sysvinit, ele ainda estará disponível como backup).
-> O Yast (gerenciador de pacotes) quer definitivamente por a baixo o mito de que é mais lento e que de sobrecreve acidentalmente arquivos que foram modificados pelos usuário o que é a pura verdade em suas primeiras versões 😛.
-> O SAX faz seu retorno na forma de SAX3, um projeto openSUSE GSOC ahhh que saudade do sax!!.
-> O Kernel Linux 3.1 tras melhorias de desempenho para gerenciamento de memória e manipulação de dados. E claro, suporte a novos hardwares, incluindo dispositivos externos como Kinect da Microsoft e do controlador de Nintendo Wii, bem como a uma variedade de placas wireless e de vídeo.
-> Google GO, syslog-ng 3.3, GCC 4.6 e LLVM v3…

Isso é só um pouquinho das grandes mudanças do OpenSuse 12.1, muitas outras podem ser vistas aqui: http://en.opensuse.org/Product_highlights

A partir do dia 16/11, já vou baixar e colocar à prova essas novidades e tudo de bom ou ruim que encontrar compartilharei com vocês!

Abraços. 🙂

Fonte:
http://en.opensuse.org/Main_Page
http://lizards.opensuse.org/2011/04/06/versionitis/
http://ostatic.com/blog/future-opensuse-versioning-decided

Publicidade

Extraindo textos a partir de imagens

Realizando um atendimento (quem lê até pensa que sou médica rs) me deparei com um problema, tinha que converter um arquivo pdf de 29 páginas para texto, até aí blz, bastava usar um:

$ pdf2text

e pronto, textos a partir do pdf em instantes.

Mas por que facilitar se podemos complicar, né!
O resultado desse comando gerava infomações lixo que não batiam com o conteúdo do pdf.

Tentando de novo, só que agora com outro tipo de arquivo de saída:

$ pdf2html

e… BINGO!! Esse pdf foi gerado a partir de várias imagens organizadas e “linkadas” num index.html. Agora tenho um arquivo html e 29 arquivos PNG.
Mas não resolvi meu problema, cadê os textos?

Vamos à “mágica”!!

OCR é um acrónimo para o inglês Optical Character Recognition, uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem, ou mapa de bits. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável.
Fonte: Wikipédia

O que temos nos repositórios do OpenSuse que pode nos ajudar…

anjos:~ # zypper search ocr
Loading repository data...
Reading installed packages...

S | Name        | Summary                                                   | Type   
--+-------------+-----------------------------------------------------------+--------
  | gocr        | Optical Character Recognition                             | package
  | gocr-gui    | Optical Character Recognition - Basic Graphical Interface | package
  | ocrad       | GNU Ocrad--Optical Character Recognition Program          | package
  | ocrad-devel | Development files for GNU ocrad                           | package

Vamos instalar o gocr.

anjos:~ # zypper install gocr
Loading repository data...
Reading installed packages...
Resolving package dependencies...

The following NEW packages are going to be installed:
  gocr gocr-gui 

2 new packages to install.
Overall download size: 377.0 KiB. After the operation, additional 912.0 KiB will be used.
Continue? [y/n/?] (y): y
Retrieving package gocr-0.48-6.4.x86_64 (1/2), 364.0 KiB (895.0 KiB unpacked)
Retrieving: gocr-0.48-6.4.x86_64.rpm [done (68.6 KiB/s)]
Retrieving package gocr-gui-0.48-6.4.x86_64 (2/2), 13.0 KiB (17.0 KiB unpacked)
Retrieving: gocr-gui-0.48-6.4.x86_64.rpm [done]
Installing: gocr-0.48-6.4 [done]
Installing: gocr-gui-0.48-6.4 [done]

Prontinho.
Agora é só testar.

A interface do programa não é das mais atrativas, mas é funcional.

Aqui é bem simples, basta escolher o arquivo de imagem e clicar em “Run it”. Depois é só salvar o resultado num txt no menu File -> Save output.

Problema resolvido né! Quase…
Imagina ter que gerar o txt de 29 imagens. Por que não otimizar?

T=1;
for A in NACERP0102*.png
do
  if [ -f $A ] ; 
  then
    gocr -i NACERP0102-$T.png -o NACERP0102-$T.txt
  fi

T=$(($T+1));
done

Obs.: Quem deu uma força gerando o script foi meu amigo Cláudio Miranda.

Missão cumprida e usuário feliz. o/

Abraços. 😀