
Преди известно време, малко след публикуването на a ръководство за Markdown, потърсих информация, за да разбера дали LibreOffice може да се използва за създаване на тези видове документи. Не намерих нищо, освен отговори като "защо искаш да направиш това?" брой. Идеята беше да се създаде документ с редактор тип Word или Writer и след това да се запише във формат .md, но както казах; Нищо не намерих. Наскоро Microsoft пусна инструмент за нещо подобно и името му е MarkItDown.
MarkItDown е a библиотека на python който може да бъде инсталиран на системата — не на Linux от Python 3.12 — или във виртуална среда (env). След инсталацията, базовата или необработена употреба ще изисква писане на няколко реда на Python, който имате по-долу. Но това не е единственият начин да го използвате.
MarkItDown с помощта на Python
API е толкова прост:
от markitdown import MarkItDown markitdown = MarkItDown() резултат = markitdown.convert("test.xlsx") print(result.text_content)
От горното, първият ред импортира библиотеката; вторият създава съвместим обект; В третия той извършва преобразуването - във файл, който в примера е наречен text.xlsx - и в четвъртия ще отпечата резултата в конзолата. Освен това, както е обяснено в вашия GitHub, може да се направи съвместим с LLM като ChatGPT, всичко това според вкуса на потребителя и в зависимост от познанията на всеки човек.
Ако кодът не е най-добрият за нас, разработчик на име Мат Палмър е създал мрежа за улесняване на задачата. Въпреки че е на английски, използването му е много лесно. В долната част на полето показва поддържаните файлове, които са PDF, PPTX, DOCX, XLSX, изображения, аудио, HTML и текстови файлове. Единственото нещо, което ще трябва да направим, е да плъзнем файл в кутията и да изчакаме магията да се случи, както се вижда на екранната снимка на заглавката.
По време на писането има проблем при изтеглянето на файла, който показва съобщение за грешка вместо текст. Възможно е, нещо, което не съм проверил, да го виждам, защото създадох файла от Linux, LibreOffice или и двете, но виждам тази грешка при изтеглянето на файла. Той прави преобразуването добре и винаги можете да копирате обикновения текст, който генерира, да го поставите в текстов файл и да го запишете с разширение .md.
За да го видим, в Linux можем да използваме инструменти като Okular, Visual Studio Code или някаква програма. тя е готоваСред другите.
Моля, обърнете внимание
Въпреки че инструментът е създаден от Microsoft, не винаги всичко ще върви добре. За да получите най-добри резултати, трябва да използвате правилните опции. Например, за да поставите a # Titular o ## Título 2, трябва да изберете това в опциите на Word или Writer. Същото с подредени или неподредени списъци, връзки, изображения... Ако вместо да използваме правилните опции, изберем текст и поставим удебелен и по-голям шрифт, Markdown не работи така и може да получим смесени резултати. За повече информация относно поддържаните марки ви препращаме към връзката, която ще намерите в първия параграф на тази бележка.
Сега това е официален инструмент на Microsoft и може да е най-добрият вариант за конвертиране на поддържани файлове в Markdown.