Учебник Numpy

IO NumPy

NumPy ввел простой формат файла для объектов ndarray: npy.

Файлы npy используются для хранения данных, необходимых для восстановления ndarray, графиков, dtype и другой информации.

Обычные функции ввода-вывода:

Функции load() и save() являются основными функциями для чтения и записи массивов данных файлов, по умолчанию массивы сохраняются в файлы с расширением .npy в некомпрессованном исходном двоичном формате. Функция savze() используется для записи нескольких массивов в файл, по умолчанию массивы сохраняются в файлы с расширением .npz в некомпрессованном исходном двоичном формате. Функции loadtxt() и savetxt() обрабатывают обычные текстовые файлы (.txt и т.д.)

numpy.save()

Функция numpy.save() сохраняет массив в файл с расширением .npy.

Пример

numpy.save(file, arr, allow_pickle=True, fix_imports=True)

Описания параметров:

file：файл, в который нужно сохранить, расширение .npy. Если расширение .npy в конце пути к файлу отсутствует, оно будет автоматически добавлено. arr: массив, который нужно сохранить allow_pickle: опционально, булево значение, разрешает использовать Python pickles для сохранения массивов объектов, pickle в Python используется для сериализации и десериализации объектов перед сохранением в файл или чтением из файла. fix_imports: опционально, для удобства чтения данных, сохраненных Python3, в Python2.

Пример

　import numpy as np　
　　
　a = np.array([1,2,3,4,5])　
　　
　# Сохранить в файл test.npy
　np.save('test.npy',a)　
　　
　# Сохранить в файл test1.npy, если в конце пути к файлу нет расширения .npy, расширение будет автоматически добавлено
　np.save('test1.npy',a)

Мы можем проверить содержимое файла:

　$ cat test.npy　
　?NUMPYv{'descr': '<i8', 'fortran_order': False, 'shape': (5,),}　
　$ cat test1.npy　
　?NUMPYv{'descr': '<i8', 'fortran_order': False, 'shape': (5,),}

Можно看出 файл является乱ым, так как это данные в бинарном формате Numpy.

Мы можем использовать функцию load() для чтения данных, и они будут правильно отображены:

Пример

import numpy as np　
b = np.load('test.npy')　
print(b)

Результат вывода:

[1 2 3 4 5]

np.savez

Функция numpy.savez() сохраняет несколько массивов в файл с расширением npz.

numpy.savez(file, *args, **kwds)

Описания параметров:

file：файл, который нужно сохранить, имеет расширение .npz，если расширение не указано в конце пути к файлу .npz，данное расширение будет автоматически добавлено. args: массивы, которые нужно сохранить, можно命名 с помощью ключевых параметров, массивы, переданные без ключевых параметров, будут автоматически названы arr_0, arr_1, … . kwds: массивы, которые нужно сохранить, должны использовать ключевые имена.

Пример

　import numpy as np
　a = np.array([[1,2,3],[4,5,6]])
　b = np.arange(0, 1.0, 0.1)
　c = np.sin(b)
　# c используется с ключевым параметром sin_array
　np.savez('w3codebox.npz', a, b, sin_array = c)
　r = np.load('w3codebox.npz')　
　print(r.files) # просмотр названий всех массивов
　print(r['arr_0']) # массив a
　print(r['arr_1']) # массив b
　print(r['sin_array']) # массив c

Результат вывода:

　['sin_array', 'arr_0', 'arr_1']
　[[1 2 3]
　　[4 5 6]
　[0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
　[0. 0.09983342 0.19866933 0.29552021 0.38941834 0.47942554
　　0.56464247 0.64421769 0.71735609 0.78332691

savetxt()

Функция savetxt() сохраняет данные в простом текстовом формате файла, для получения данных используется функция loadtxt().

　np.loadtxt(FILENAME, dtype=int, delimiter='　')
　np.savetxt(FILENAME, a, fmt="%d", delimiter=",")

Параметр delimiter может指定 различные разделители, функции преобразования для конкретных столбцов, количество пропущенных строк и т.д.

Пример

　import numpy as np
　a = np.array([1,2,3,4,5])　
　np.savetxt('out.txt',a)　
　b = np.loadtxt('out.txt')　
　　
　print(b)

Результат вывода:

[1. 2. 3. 4. 5.]

Использование параметра delimiter:

Пример

　import numpy as np
　a=np.arange(0,10,0.5).reshape(4,-1)
　np.savetxt("out.txt",a,fmt="%d",delimiter=",")  # Сохранить как целое число, разделителем запятой
　b = np.loadtxt("out.txt",delimiter=",")  # При загрузке также необходимо指定 разделителем запятой
　print(b)

　　　[[0. 0. 1. 1. 2.]]
　　[2. 3. 3. 4. 4.]
　　[5. 5. 6. 6. 7.]
　　[7. 8. 8. 9. 9.]]

NumPy Matplotlib Линейная алгебра NumPy