Откройте .doc файл с помощью Writer (его можно скачать в составе OpenOffice.org по адресу ru.openoffice.org) и сохраните в собственном формате ".odt". Этот файл по сути — простой zip-архив, поэтому сменив расширение на .zip, вы получите архив, где среди кучи других файлов будут и искомые картинки.
Очень помогает, когда оригиналы получить не представляется возможным.
P.S..docx — тоже zip-архивы.
Связанный совет: https://kstatida.com/ne-vstavlyajte-logotip-fotografiyu-kartinku-v-dokument-word-a
1
1
?
1 IT
1 Windows
причём тут виндус?
Ну это ж работает под Виндой! Хотя и не только там…
в том-то и дело, что опенофис работает где угодно
Тег действительно можно убрать, просто я не знаю, как сделать это самостоятельно.
MS Office ведь только под виндой. Так что нормальный тег.
а про мс-офис в совете речь и не идёт, речь о файле *.doc, который я мог получить по почте / скачать из инета / етц
А вот и не только под Виндой. :-Ь
Вообще-то, к чему это, если можно изображение сохранить прямо из Райтера?
вероятно для таких случаев, когда картинок 100500 штук
Я просто не догадался ткнуть правой кнопкой в рисунок в Writer'е.
раздобыл .doc с картинками, проверил способ, плюсую :)
попутно вспомнил другой способ — достаточно прям в мс-ворде сохранить файл как html и все картинки высыпятся
Кстати, да.
Особо поддерживаю про *.docx и вообще файлы MS Office 2007. Это стандарт Open XML, по сути — Zip архив, внутри которого хранятся данные в XML и вложенные объекты (картинки, например). Помнится, был один случай у меня. Ходил тогда по сети "Тест на гениальность", оформленный в формат Excel (старый). И вот этот то тест целиком пройти никто не мог, я поспорил с одним приятелем, что отвечу на все вопросы теста за 5 минут. Открываю файл в 2007-м офисе, пересохраняю в OpenXML, меняю расширение на Zip, делаю поиск по файлам на предмет вхождения в них текста вопроса — вуаля! XML файл с парами вопрос-ответ. Да, дополнительное пиво за раскрытие секрета своей "гениальности" я тоже заработал :)
Я не доверяю стандартам, занимающим почти 7000 (да-да, семь тысяч) страниц. Но это мое личное мнение.
И никто из поставивших минус комментарию не написал ни слова в ответ. Задумайтесь: вы способны прочитать 7000 страниц технической документации? А понять и корректно реализовать? Продукты MSO зачастую несовместимы между версиями, и дело тут не в новых возможностях. Дело в том что сами разработчики не до конца разбираются в своём же стандарте.
Open XML? Это просто перевод бинарного формата в xml фактически один в один.
Если какую-то возможность можно реализовать тремя способами, она реализована в форматах MSO тремя способами. И еще двумя, о которых вы даже не задумывались.
Факт — после принятия стандарта на Office Open XML выяснилось, что Office 2007 поддерживает его некорректно, и полная поддержка заявлена в Office 2010. Вдумайтесь — Office 2007, с которого и писался стандарт, некорректно его поддерживает (news.cnet.com/Office-2007-fails-OOXML-conformance-test/2100-7344_3-6237855.html)
А можно достать картинки еще проще, без лишнего софта и без потери качества. Сохраняешь документ как .html и получаешь сам html файл и привязаную к нему папку с картинками.
1 софт
Еще бы из закрытых pdf'ок можно было так доставать. картинки и текст.
Abad, а при распознавании пдф файлов в том же Файнридере разве так не получается?
В windows есть по крайней мере pdftotext (en.wikipedia.org/wiki/Pdftotext). Если же у вас Ubuntu, то sudo apt-get install poppler-utils и потом pdftotext file.pdf и pdfimages file.pdf target-directory/. Есть еще pdftops, pdftoppm и pdftohtml.
К сожалению, нет под рукой защищенных pdf, но если мои познания о принципах защиты pdf верны (внутри файла установлен флаг и копировать не даёт только просмотрщик), этим утилитам это не будет помехой.
1 Ворд