Если вы продвинутый пользователь Excel, вероятно, вы использовали VBA для создания макросов и автоматизации повторяющихся задач или использовали Power Query для очистки и преобразования данных.
Это хорошие инструменты, но когда дело доходит до создания пользовательской автоматизации и работы с большими данными на высокой скорости, Microsoft Excel недостаточно.
Вот когда вам нужен язык программирования, такой как Python.
Python имеет сотни библиотек, которые делают возможным манипулирование данными, анализ и автоматизацию отчетов. Python может не только помочь вам выполнять задачи Excel, но и выйти за рамки этого и помочь вам выполнять более сложные задачи.
В этой статье я покажу лучший способ для пользователей Excel начать работу с Python с нуля, а также познакомлю вас с 3 библиотеками Python, которые помогут вам вывести анализ данных и отчеты Excel на следующий уровень.
1. Изучите Python и Pandas для лучшего анализа данных
Python – часто используемый язык, который имеет множество приложений. Одним из таких приложений является анализ данных. Мы можем выполнять анализ данных с помощью Python, пользуясь библиотекой под названием Pandas.
Библиотека Pandas известна как “Excel на стероидах”, потому что вы можете выполнять большинство задач, которые вы выполняете в Microsoft Excel, но с помощью Python и более эффективно. Это означает, что мы можем очищать и разбирать большие наборы данных и создавать сводные таблицы и диаграммы без проблем с производительностью. Разница в том, что в Pandas мы работаем с кадрами данных, а в Excel – с рабочими листами.
Вот некоторые из преимуществ Python / Pandas перед Excel:
- Excel может обрабатывать 1 миллион строк.
- Python может обрабатывать сложные вычисления, в то время как это может привести к сбою книги в Excel.
- Автоматизация в Excel ограничена VBA и Power Query, в то время как возможности Python безграничны благодаря сотням бесплатных библиотек.
Если вы пользователь Excel, который никогда раньше не писал ни одной строки кода, идея перехода на Python может показаться пугающей, но есть бесплатные учебные пособия, которые могут научить вас Python с нуля с учетом знаний, которые у вас есть в Excel.
2. Mito: если вы можете редактировать файл Excel, теперь вы можете писать код Python
Если вы хотите иметь силу Python с простотой Microsoft Excel, вы должны попробовать библиотеку Mito.
Mito – это электронная таблица внутри Python. Эта библиотека поможет вам работать с фреймом данных Pandas, как если бы это была книга Excel. Это означает, что нам больше не нужно писать код Python для манипулирования фреймом данных, но мы можем выполнять анализ данных с помощью нескольких кликов с помощью Python.
Чтобы сделать еще лучше, Mito будет генерировать код Python для вас после каждой модификации, которую вы делаете в электронной таблице Mito.
Скажем, вы хотите прочитать файл CSV, а затем сделать boxplot. С Pandas вам нужно использовать .read_csv
метод для чтения CSV-файла, а затем использовать .iplot(kind='box')
метод для создания boxplot.
Однако с Mito вы сможете сделать все это без написания кода, но сначала нужно будет установить его с помощью pip, выполняющего команды ниже (на Jupyter Notebook и JupyterLab вам нужно запустить команды в ячейке).
python -m pip install mitoinstaller
python -m mitoinstaller install
Теперь мы можем создать таблицу mitosheet с приведенным ниже кодом. Вот и весь код, который вам нужно написать!
импорт mitosheet
mitosheet.лист ()
Если вы видите лист, подобный приведенному ниже, все было настроено успешно. Теперь мы можем выполнять множество задач с помощью пары кликов. Для этого примера я буду использовать файл “StudentsPerformance_id.csv”, доступный на Google Диске.
Мы можем импортировать этот CSV-файл с помощью Mito. Вам нужно только нажать кнопку “Импорт” и выбрать файл CSV, который вы загрузили ранее.
Теперь мы можем создать boxplot (и другие графики), нажав на кнопку “График” и выбрав “поле” в опции “Тип диаграммы”, как показано на gif ниже.
Отлично! Чтобы получить код, используемый для графика, нажмите кнопку “Скопировать код графика”. Для получения дополнительной информации об этой библиотеке проверьте Github и документацию Mito.
3. С помощью Python и Openpyxl автоматизируйте Excel
Помимо анализа данных, Python часто используется для автоматизации задач. С помощью Python вы можете автоматизировать работу в Интернете, отправлять электронные письма, файлы и папки!
Вы можете использовать Python, библиотеку Pandas и модуль OS для простой автоматизации, такой как объединение нескольких файлов Excel, изменение имени / расширения нескольких файлов и даже изменение данных внутри файлов (скажем, вы хотите добавить / удалить некоторые символы).
Вы можете сделать более сложную автоматизацию, такую как создание отчетов Excel, используя библиотеку под названием openpyxl. Эта библиотека позволяет нам загружать книги и манипулировать ими, как если бы мы использовали Microsoft Excel (но с мощью Python).
С помощью Python мы можем сделать создание отчета Excel таким же простым, как двойной щелчок по файлу.
Представьте, что вам нужно создать сводную таблицу, а затем добавить формулы, диаграмму и заголовок / подзаголовок на рабочий лист. Ну, вы можете сделать все это с помощью Python.
Сначала вы можете создать сводную таблицу с помощью библиотеки Pandas, а затем добавить формулы, диаграммы и текст с помощью openpyxl. Если вы хотите перейти на следующий уровень, вы можете использовать библиотеку pyinstaller, которая преобразует скрипт Python в исполняемый файл, поэтому каждый раз, когда вы дважды щелкаете по исполняемому файлу, отчет генерируется автоматически.
Оцените статью или оставьте комментарий, и всем зарегистрировавшемся пользователям, у которых указана почта, мы вышлем на нее руководство по автоматизации отчетов Excel с помощью Python.