# Entrées-sorties

Commencer une ligne avec `!` vous donne accès aux commandes du shell. Par exemple, `! ls` (pour Linux ou Mac) ou `! dir` (pour Windows) permet d'afficher les fichiers présents dans votre répertoire de travail :

In [12]:
! ls

AnoTempe.png
banksy.txt
etu-01-entrees-sorties.ipynb
etu-02-ajustement-modele.ipynb
etu-03-exercices.ipynb
etu-04-mini-projet-rechauffement-climatique.ipynb
exo-write.txt
exoplanets-SI.dat
exoplanets.csv
exoplanets.dat
montelimar_temperature.dat
table_analyse_chute.png
test.txt
verne-lune.txt


## **Vidéo**: Lire et écrire

In [13]:
%%HTML
<iframe src="https://sorbonne-universite.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=7bf616ba-4e65-48b6-aa69-adb100bae47a&autoplay=false&offerviewer=true&showtitle=true&showbrand=false&captions=false&interactivity=all" height="405" width="720" style="border: 1px solid #464646;" allowfullscreen allow="autoplay"></iframe>

## Lire un fichier texte
Nous avons extrait un passage du livre *De la Terre à la Lune, trajet direct en 97 heures 20 minutes*, paru en 1865 et écrit par Jules Verne (1828-1905). Il est [disponible librement](https://www.gutenberg.org/ebooks/799) sur le site du Projet Gutenberg. Cet extrait est enregistré dans le fichier nommé *verne-lune.txt*.

Pour pouvoir importer le texte dans Python, il faut d'abord ouvrir le fichier avec la fonction `open()` :

In [14]:
# Ouverture du fichier texte
file = open('verne-lune.txt', mode = 'r', encoding = 'utf-8')

Nous avons donné à l'argument `mode` la valeur `r` pour ouvrir le fichier seulement en lecture et pas en écriture (*read-only*). Cela permet d'empêcher toute modification du fichier. Afin de lire tout le fichier, on peut utiliser la méthode `.read()` sur la variable `file` :

In [15]:
# Lecture du fichier
print(file.read())

                                  _Longs's-Peak, 12 décembre._

A MM. LES MEMBRES DU BUREAU DE L'OBSERVATOIRE DE CAMBRIDGE.

_Le projectile lancé par la Columbiad de Stone's-Hill a été aperçu par
MM. Belfast et J.-T. Maston, le 12 décembre, à huit heures
quarante-sept minutes du soir, la Lune étant entrée dans son dernier
quartier.

Ce projectile n'est point arrivé à son but.  Il a passé à côté, mais
assez près, cependant, pour être retenu par l'attraction lunaire.

Là, son mouvement rectiligne s'est changé en un mouvement circulaire
d'une rapidité vertigineuse, et il a été entraîné suivant une orbite
elliptique autour de la Lune, dont il est devenu le véritable
satellite.

Les éléments de ce nouvel astre n'ont pas encore pu être déterminés.
On ne connaît ni sa vitesse de translation, ni sa vitesse de rotation.
La distance qui le sépare de la surface de la Lune peut être évaluée à
deux mille huit cent trente-trois milles environ (-- 4,500 lieues).

Maintenant, deux hypothèses peuvent s

Une fois fini, il faut libérer la mémoire en fermant le fichier. On peut vérifier si le fichier est ouvert ou fermé en affichant l'attribut `closed` de l'objet `file` :

In [16]:
# Vérifie si le fichier est fermé
print(file.closed)

False


Le fichier n'est pas fermé. On peut le fermer avec la méthode `.close()` :

In [17]:
# Fermeture du fichier
file.close()

# Vérifie si le fichier est fermé
print(file.closed)

True


On peut aussi ne lire qu'une seule ligne avec la méthode `.readline()`. Si on utilise de nouveau cette méthode, alors Python lit la ligne suivante :

In [18]:
# Ouverture du fichier texte
file = open('verne-lune.txt', mode = 'r', encoding = 'utf-8')

# Lecture des 3 premières lignes
print(file.readline())
print(file.readline())
print(file.readline())

# Fermeture du fichier
file.close()

                                  _Longs's-Peak, 12 décembre._



A MM. LES MEMBRES DU BUREAU DE L'OBSERVATOIRE DE CAMBRIDGE.



### Exercice

1. Ouvrir le fichier *banksy.txt* en lecture seul
2. Afficher le fichier
3. Fermer le fichier

In [19]:
# 1
file_banksy = open('banksy.txt', mode='r', encoding='utf-8')

# 2
print(file_banksy.read())

# 3 
file_banksy.close()


                        .s$$$Ss.
            .8,         $$$. _. .              ..sS$$$$$"  ...,.;
 o.   ,@..  88        =.$"$'  '          ..sS$$$$$$$$$$$$s. _;"'
  @@@.@@@. .88.   `  ` ""l. .sS$$.._.sS$$$$$$$$$$$$S'"'
   .@@@q@@.8888o.         .s$$$$$$$$$$$$$$$$$$$$$'
     .:`@@@@33333.       .>$$$$$$$$$$$$$$$$$$$$'
     .: `@@@@333'       ..>$$$$$$$$$$$$$$$$$$$'
      :  `@@333.     `.,   s$$$$$$$$$$$$$$$$$'
      :   `@33       $$ S.s$$$$$$$$$$$$$$$$$'
      .S   `Y      ..`  ,"$' `$$$$$$$$$$$$$$
      $s  .       ..S$s,    . .`$$$$$$$$$$$$.
      $s .,      ,s ,$$$$,,sS$s.$$$$$$$$$$$$$.
      / /$$SsS.s. ..s$$$$$$$$$$$$$$$$$$$$$$$$$.
     /`.`$$$$$dN.ssS$$'`$$$$$$$$$$$$$$$$$$$$$$$.
    ///   `$$$$$$$$$'    `$$$$$$$$$$$$$$$$$$$$$$.
   ///|     `S$$S$'       `$$$$$$$$$$$$$$$$$$$$$$.
  / /                      $$$$$$$$$$$$$$$$$$$$$.
                           `$$$$$$$$$$$$$$$$$$$$$s.
                            $$$"'        .?T$$$$$$$
                           .$'        ...      ?

## Gestionnaire de contexte
Le flux d'instructions introduit précédemment peut poser problème : si une erreur intervient avant la fermeture du fichier (avec la méthode `.close()`), celui-ci ne sera pas fermé et des données pourraient être perdues.

La meilleure manière de faire est d'utiliser un **gestionnaire de contexte**, que l'on utilise avec l'instruction `with` de la façon suivante :

In [20]:
# Ouverture et lecture du fichier avec un gestionnaire de contexte
with open('verne-lune.txt', mode = 'r', encoding = 'utf-8') as file:
    print(file.readline())

                                  _Longs's-Peak, 12 décembre._



La fermeture du fichier est alors implicite. On peut aussi écrire dans un fichier avec la méthode `.write()`. Pour cela, il faut ouvrir le fichier avec le mode `'w'` (*write*) :

In [22]:
# Ouverture et écriture dans un fichier avec un gestionnaire de contexte
with open('test.txt', mode = 'w') as file:
    file.write('Je sais écrire dans un fichier !\nSuper !')

Le caractère spécial `\n` dans la chaîne de caractères permet le retour à la ligne.

Il existe de nombreux [modes d'ouverture d'un fichier](https://docs.python.org/fr/3/library/functions.html#open), les principaux étant :

| Caractère | Signification
|--|--
| `'r'` | ouvre en lecture (par défaut)
| `'w'` | ouvre en écriture, tronquant le fichier
| `'x'` | ouvre pour une création exclusive, échouant si le fichier existe déjà
| `'a'` | ouvre en écriture, ajoutant à la fin du fichier s'il existe

### Exercice
En utilisant un gestionnaire de contexte et une boucle `for` :

1. Afficher la ligne 13 du fichier *verne-lune.txt*. Pour cela il faut exécuter 12 fois la méthode `.readline()` sans `print()`, puis une treizième fois avec `print()`
2. Créez un fichier nommé *exo-write.txt* dans lequel vous écrirez tous les entiers entre 1 et 100 (avec un entier par ligne)

In [27]:
# 1
with open('verne-lune.txt', mode='r', encoding='utf-8') as file:
    for i in range(14):
        line = file.readline()
        if (i == 13):
            print(line)

d'une rapidité vertigineuse, et il a été entraîné suivant une orbite



In [31]:
# 2
with open('ca-entiers.txt', mode='w', encoding='utf-8') as file:
    for i in range(1, 101):
        file.write(str(i)+'\n')

## **Vidéos**: Outils supplémentaires

In [32]:
%%HTML
<iframe src="https://sorbonne-universite.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=d0b75135-d38b-4641-98c2-adb100baec9f&autoplay=false&offerviewer=true&showtitle=true&showbrand=false&captions=false&interactivity=all" height="405" width="720" style="border: 1px solid #464646;" allowfullscreen allow="autoplay"></iframe>

## Lire le clavier
La fonction `input()` lit tout ce qui est écrit au clavier comme une chaîne de caractères :

In [33]:
# Lire ce qui est écrit au clavier (finir avec la touche entrée)
chaine = input("Entrez votre message avec input:\n")

# Afficher ce qui a été écrit
print("Vous avez entré :", chaine)
print(type(chaine))

Vous avez entré : 3
<class 'str'>


### Exercice

1. Avec la fonction `input()`, demander à l'utilisateur d'entrer un entier au clavier et affecter la valeur à une variable `sn`
2. Convertir la variable `sn` en entier avec la fonction `int()`, et affecter la valeur à une variable `n`
3. Afficher le carré de `n` à l'écran

In [35]:
# 1
sn = input('Écrivez un entier: \n')

# 2
n = int(sn)

# 3
print(n ** 2)

4761


## Format défini
Dans l'exemple suivant nous affichons les valeurs des variables `x` et `n` avec un format défini. La syntaxe est similaire à celle d'autres langages comme Matlab ou C :

In [36]:
# Création des variables
x = 45.9876
n = 6

# Affichage avec un format défini
print('x = %5.3f, n = %d' % (x, n))
print('x = %5.3e, n = %5d' % (x, n))

x = 45.988, n = 6
x = 4.599e+01, n =     6


`%5d`

- `5` est le nombre de caractères imprimés, y compris les espaces blancs
- `d` indique un entier

`%5.3f`

- `5` est le nombre total de caractères imprimés, y compris le signe - si le chiffre est négatif, ou tout autre caractère. Cependant le nombre de caractères imprimés sera supérieur à ce chiffre si il est trop petit pour pouvoir atteindre la pécision requise dans l'affichage : dans l'exemple donné, le nombre total de caractères imprimés est 6
- `3` est le nombre de chiffres après le point décimal (6 par défaut)
- `f` donne le type, ici le format fixe pour un réel

`%5.3e`

- la seule différence est `e` qui donne le type d'affichage exponentiel

Une syntaxe alternative a été introduite depuis Python 2.6 avec la méthode `.format()` des chaînes de caractères :

In [37]:
print('x = {:f}, n = {}'.format(x, n))
print('x = {:8.3f}, n = {:d}'.format(x, n))

x = 45.987600, n = 6
x =   45.988, n = 6


Un bon endroit pour découvrir toutes les possibilités offertes par le formatage en Python, dans les deux styles d'écriture, est le [site pyformat](https://pyformat.info).

## Lire et écrire des tableaux Numpy
Pour importer les données d'un fichier texte dans un tableau Numpy on peut utiliser la fonction `loadtxt()`. Chaque ligne du fichier doit avoir le même nombre de valeurs. Par défaut les lignes commençant par # ne sont pas lues. Elles sont généralement utilisées pour décrire les données dans l'en-tête du fichier.

Nous disposons d'un fichier *exoplanets.dat* qui décrit les caractéristiques de 256 [exoplanètes](https://fr.wikipedia.org/wiki/Exoplan%C3%A8te). Ces données sont tirées du site internet [exoplanets.org](http://exoplanets.org). Chaque ligne du fichier caractérise une exoplanète et l'étoile autour de laquelle elle gravite. Les quatre colonnes donnent :

1. le demi-grand axe de l'orbite parcourue par la planète en [unités astronomiques](https://fr.wikipedia.org/wiki/Unit%C3%A9_astronomique) ;
2. la période orbitale en jours ;
3. la masse de la planète en unités de masse de Jupiter ;
4. la masse de l'étoile autour de laquelle la planète gravite en unités de masse solaire.

Importons les données dans la variable `data` grâce à la fonction `loadtxt()` de Numpy :

In [38]:
# Importation du module numpy
import numpy as np

# Importation des données
data = np.loadtxt('exoplanets.dat')

Nous vérifions que `data` est bien un tableau Numpy de forme (256, 4) :

In [39]:
print(type(data))
print(data.shape)

<class 'numpy.ndarray'>
(256, 4)


Plutôt que de créer un tableau 2D, il est possible de créer 4 tableaux 1D contenant les données de chaque colonne directement avec l'argument `unpack` :

In [40]:
a, p, mp, me = np.loadtxt('exoplanets.dat', unpack = True)

Nous voulons changer les unités des données en [unités S.I.](https://fr.wikipedia.org/wiki/Syst%C3%A8me_international_d%27unit%C3%A9s) et sauvegarder les nouvelles données dans un nouveau fichier. D'abord, changeons les unités :

In [41]:
# Set constants
au2m = 149597870700. # Conversion from astronomical units to m
day2seconds = 24. * 60. * 60. # Conversion from day to seconds
M_jupiter = 1.898e27 # Jupiter mass in kg
M_sun = 1.9891e30 # Solar mass in kg

# Change units to SI
a_SI = a * au2m
p_SI = p * day2seconds
mp_SI = mp * M_jupiter
me_SI = me * M_sun

On peut ensuite sauvegarder les nouvelles données dans le fichier *exoplanets-SI.dat* avec la fonction Numpy `savetxt()` :

In [42]:
np.savetxt('exoplanets-SI.dat', np.c_[a_SI, p_SI, mp_SI, me_SI], fmt = '%10.3e')

On a utilisé la commande Numpy `c_[]` pour concaténer en colonnes les tableaux 1D. L'argument `fmt` permet de spécifier le format d'écriture, avec la même syntaxe vue plus haut pour `print`.

## Importer des données mixtes avec Pandas
Il arrive souvent que les données à importer soient de types différents. Il n'est pas très pratique de les importer avec Numpy. On peut alors utiliser le module Pandas. Nous avons sauvegardé un fichier plus complet contenant les informations de 3236 exoplanètes, sous la forme d'un fichier csv. La signification des différentes colonnes est expliquée sur le site [exoplanets.org](http://exoplanets.org/table). Ces colonnes contiennent à la fois des données numériques et du texte. On ne peut pas utiliser la fonction `loadtxt()`.

Comme expliqué dans le module *Dictionnaires et Pandas*, on utilise la fonction `read_csv()` pour importer et créer un DataFrame :

In [43]:
# Importer le module pandas
import pandas as pd

# Importer les données dans un DataFrame
data = pd.read_csv('exoplanets.csv')

Nous vérifions que les données ont bien été importées :

In [44]:
# Affichage des 3 premières lignes
data.head(n = 3)

Unnamed: 0,NAME,MSINI,A,PER,ECC,OM,T0,K,ORBREF,ORBURL,FIRSTREF,FIRSTURL
0,Kepler-107 d,,0.07801,7.958203,,90.0,2454971.0,,Rowe 2014,http://adsabs.harvard.edu/abs/2014arXiv1402.6534R,Rowe 2014,http://adsabs.harvard.edu/abs/2014arXiv1402.6534R
1,Kepler-1049 b,,0.034472,3.273461,0.0,90.0,,,Morton 2016,http://adsabs.harvard.edu/abs/2016ApJ...822...86M,Morton 2016,http://adsabs.harvard.edu/abs/2016ApJ...822...86M
2,Kepler-813 b,,0.13761,19.129473,0.0,90.0,,,Morton 2016,http://adsabs.harvard.edu/abs/2016ApJ...822...86M,Morton 2016,http://adsabs.harvard.edu/abs/2016ApJ...822...86M


On voit que les données manquantes ont été remplacées par NaN ([Not-a-Number](https://fr.wikipedia.org/wiki/NaN)).

On peut maintenant utiliser ces données, par exemple pour savoir combien de planètes ont été reportées pour la première fois dans la référence *Morton 2016* :

In [45]:
# Nombre de planètes dans Morton 2016
print(np.sum(data['FIRSTREF'] == 'Morton 2016'))

1283


Remarquez que dans cette commande on a sommé les éléments d'un objet Series contenant des booléens. Dans ce cas, la valeur `True` est considérée comme un `1`, et la valeur `False` comme un `0`.