Création d'une connexion Hive

  1. Ouvrez l'activité Load to Hive.
  2. Dans le champ Nom de fichier, saisissez le nom du fichier à lire. Cliquez sur Parcourir [...] pour sélectionner le fichier à lire.
  3. Dans le champ Type de fichier, saisissez le format du fichier à lire. Le format de fichier par défaut sélectionné est Delimited.
    Si le Type de fichier sélectionné est Delimited ou Sequence, les champs Séparateur de champ et Séparateur d'enregistrement sont affichés. Sinon, ils ne sont pas affichés.
  4. Dans le champ Séparateur de champ, sélectionnez le caractère de séparation de chaque champ consécutif d'un enregistrement.
  5. Sélectionnez la connexion de la base de données Hive que vous souhaitez utiliser dans le champ Connexion.
    1. Pour ajouter, modifier et supprimer des connexions, cliquez sur Gérer.
      La fenêtre Gestionnaire de connexion à la base de données s'ouvre.
    2. Cliquez sur Ajouter pour créer une connexion ou sur Modifier pour modifier une connexion existante.
      La fenêtre Propriétés de la connexion s'ouvre.
    3. Saisissez le Nom de la connexion.
    4. Dans le champ Pilote de base de données, sélectionnez un pilote de base de données Hive pour la connexion.
    5. Indiquez tous les détails de la connexion, à savoir Utilisateur, Mot de passe, Hôte, Port et Instance.
    6. Pour tester les détails de la connexion, cliquez sur Tester.
    7. Si le test de connexion réussit, cliquez sur OK.
      La fenêtre Propriétés de la connexion se ferme.
    8. Cliquez sur OK.
      La fenêtre Gestionnaire de connexion à la base de données se ferme.
  6. Dans le champ Table/Vue, sélectionnez la table dans laquelle vous souhaitez écrire, ou saisissez le nom d'une nouvelle table à créer.
    Si vous créez une nouvelle table dans le champ Table/Vue, la case Externe est cochée. Sinon, si vous sélectionnez une table existante, la case Externe reste décochée.
  7. Pour créer la nouvelle table externe à la base de données Hive, cochez la case Externe.
    Important : En cas de tables externes :
    1. Les enregistrements existants ne peuvent pas être écrasés, et les nouveaux enregistrements ne peuvent pas être ajoutés. Vous êtes uniquement autorisé à créer de nouvelles tables externes et à les renseigner à l'aide des enregistrements.
    2. Si vous sélectionnez un fichier placé dans un dossier donné, tous les fichiers placés dans ce dossier sont automatiquement sélectionnés. Par conséquent, assurez-vous que tous les fichiers placés dans le dossier donné présentent le même format.
    Pour en savoir plus sur les tables EXTERNES, cliquez ici.
  8. Pour remplacer tous les enregistrements existants de la table, cochez la case Écraser. Cela supprime les enregistrements existants de la table sélectionnée et ajoute que les enregistrements lus du fichier à la table.
  9. La grille affiche les noms et les types de données des colonnes de la table sélectionnée.
    Si vous avez spécifié une nouvelle table dans le champ Table/Vue, utilisez les boutons Ajouter, Modifier et Supprimer en regard de la grille pour ajouter des colonnes pour définir la table et spécifier leurs types de données respectifs. Utilisez les boutons Déplacer vers le haut et Déplacer vers le bas pour spécifier la séquence des colonnes de la table.
    Remarque : Les boutons Ajouter, Modifier, Supprimer, Déplacer vers le haut et Déplacer vers le bas restent désactivés si vous sélectionnez une table existante dans le champ Table/Vue.
    Important :
    1. Vérifiez que les types de données de tous les champs du fichier correspondent aux types de données des colonnes de table respectives, sauf si tous les types de données sont de type Chaîne. Sinon, le chargement de données peut entraîner des données incohérentes.
    2. Assurez-vous que le nombre de champs du fichier correspond au nombre de colonnes de la table. Sinon, les données des champs supplémentaires du fichier sont ignorées.
    3. Hive accepte les noms de table et de colonne en minuscules uniquement. Si vous saisissez les noms en lettres majuscules, Hive les convertit en minuscules. Le schéma qui en résulte affiche tous les noms en minuscules.
  10. Cliquez sur OK.
Remarque : Si vous décidez de créer une table et de définir ses colonnes, cette table est créée lors de l'exécution. L'activité Load to Hive est uniquement prévue pour concevoir la structure de la table. Lors de l'exécution, la table conçue est créée et les données lues du fichier y sont écrites.