Os audiolivros estão ganhando cada vez mais popularidade em relação aos eBooks tradicionais. Eles são mais convenientes, pois você pode ouvi-los a qualquer hora e em qualquer lugar.
Você pode transformar um PDF de eBook em um audiolivro com um script Python simples. Usando algumas bibliotecas simples, você pode desenvolver um projeto que lerá um PDF e armazenará o audiolivro uma vez que um novo registo.
Instalando os Pacotes Necessários
Você precisa instalar o PyPDF3, pyttsx3e pdfencanador pacotes para iniciar. Você pode instalar esses pacotes usando o gerenciador de pacotes pip. Verifique se você já instalou o pip em seu sistema. Execute o seguinte comando no prompt de comando para instalar os pacotes:
pip install PyPDF3 pyttsx3 pdfplumber
- Você pode usar o PyPDF3 livraria para ler e editar arquivos PDF em Python.
- o pyttsx3 livraria fornece conversão de texto para fala.
- pdfencanador é uma livraria que permite extrair texto e tabelas de arquivos PDF.
O código usado neste projeto está disponível em um repositório GitHub e é gratuito para você usar sob a licença MIT.
Convertendo um PDF em um Audiobook Usando Python
Depois de instalar os pacotes supra, você está pronto para importá-los para o seu registo python:
import PyPDF3
import pyttsx3
import pdfplumber
Você precisa fornecer o nome e o sítio do registo PDF que deseja transformar. Para simplificar, você pode usar qualquer registo PDF de réplica. Copie-o para o mesmo diretório do seu script e armazene seu nome em uma variável; se é chamado Lorem.pdfpor exemplo:
file = 'Lorem.pdf'
Em seguida, crie um objeto de registo para o registo PDF e um objeto leitor de PDF:
book = open(file, 'rb')
pdfReader = PyPDF3.PdfFileReader(book)
Mais tarde, você percorrerá todas as páginas do registo PDF. Para encontrar o número totalidade de páginas, use o numPáginas propriedade:
pages = pdfReader.numPages
Agora, você está pronto para extrair o texto do registo PDF:
finalText = ""with pdfplumber.open(file) as pdf:
for i in range(0, pages):
page = pdf.pages[i]
text = page.extract_text()
finalText += text
Use um loop for para percorrer todas as páginas e extrair o texto do PDF. Você pode usar o pacote pdfplumber para penetrar o registo pdf e o extrato_texto método para buscar texto de uma página.
Com o texto completo armazenado em uma variável, você pode processá-lo ainda mais, dependendo de suas necessidades. Se você quiser transformar o texto em áudio e salvá-lo em um novo registo, use o seguinte código:
engine = pyttsx3.init()
engine.save_to_file(finalText, 'lorem.mp3')
engine.runAndWait()
Quando você executa esse código Python, ele cria um registo de audiolivro em seu diretório.
Se você não deseja salvar o audiolivro e, por exemplo, deseja recitar o registo PDF, pode usar o seguinte código:
engine = pyttsx3.init()
engine.say(finalText)
engine.runAndWait()
Quando você executar nascente script, ele irá recitar o registo PDF.
Desenvolver projetos usando Python
Python é espargido por sua versatilidade. Você pode produzir projetos facilmente com aplicativos práticos usando Python.
Se você quer colocar a mão na tamanho com código Python, pode iniciar desenvolvendo miniprojetos. Algumas boas ideias iniciais são um aplicativo de quiz, chatbot, jogo de serpente, encurtador de URL, raspador da web ou conversor de unidades.