Text copied to clipboard!

Název

Text copied to clipboard!

Hadoop Inženýr

Popis

Text copied to clipboard!
Hledáme zkušeného Hadoop Inženýra, který se připojí k našemu týmu a pomůže nám spravovat, optimalizovat a rozvíjet naše datové infrastruktury. Jako Hadoop Inženýr budete zodpovědní za návrh, implementaci a údržbu Hadoop clusterů, zajištění jejich vysoké dostupnosti a výkonu a spolupráci s datovými analytiky a vývojáři na efektivním využití velkých dat. Vaše hlavní úkoly budou zahrnovat instalaci, konfiguraci a správu Hadoop ekosystému, včetně komponent jako HDFS, YARN, MapReduce, Hive, Spark a dalších. Budete monitorovat výkon clusteru, identifikovat a řešit problémy, provádět ladění výkonu a optimalizaci zdrojů. Dále budete zodpovědní za zabezpečení dat, správu uživatelských oprávnění a implementaci zálohovacích a obnovovacích strategií. Spolupráce s vývojovými týmy bude klíčová pro zajištění efektivního využití Hadoop platformy. Budete poskytovat podporu při vývoji a nasazování datových aplikací, pomáhat s optimalizací dotazů a pracovních postupů a zajišťovat, že infrastruktura odpovídá požadavkům na škálovatelnost a výkon. Ideální kandidát by měl mít hluboké znalosti Hadoop ekosystému, zkušenosti s administrací Linuxových serverů a skriptováním v Bash nebo Pythonu. Dále by měl mít zkušenosti s nástroji pro monitorování a správu clusterů, jako jsou Ambari, Cloudera Manager nebo podobné. Znalost cloudových platforem, jako AWS, Azure nebo Google Cloud, je výhodou. Pokud máte vášeň pro práci s velkými daty, rádi řešíte technické výzvy a chcete se podílet na budování robustní datové infrastruktury, rádi vás přivítáme v našem týmu!

Odpovědnosti

Text copied to clipboard!
  • Správa a údržba Hadoop clusterů.
  • Optimalizace výkonu a škálovatelnosti datové infrastruktury.
  • Monitorování a řešení problémů s výkonem a dostupností.
  • Zajištění bezpečnosti a správy uživatelských oprávnění.
  • Spolupráce s datovými analytiky a vývojáři na optimalizaci pracovních postupů.
  • Implementace zálohovacích a obnovovacích strategií.
  • Automatizace správy a monitorování clusterů.
  • Dokumentace konfigurací a postupů správy systému.

Požadavky

Text copied to clipboard!
  • Zkušenosti s administrací Hadoop ekosystému (HDFS, YARN, MapReduce, Hive, Spark).
  • Znalost Linuxových operačních systémů a skriptování (Bash, Python).
  • Zkušenosti s nástroji pro správu clusterů (Ambari, Cloudera Manager).
  • Schopnost analyzovat a optimalizovat výkon datových aplikací.
  • Znalost cloudových platforem (AWS, Azure, Google Cloud) výhodou.
  • Zkušenosti s databázemi a SQL dotazy.
  • Schopnost pracovat v týmu a komunikovat s různými odděleními.
  • Analytické myšlení a schopnost řešit technické problémy.

Potenciální otázky na pohovor

Text copied to clipboard!
  • Jaké máte zkušenosti s administrací Hadoop clusterů?
  • Jak byste optimalizovali výkon Hadoop ekosystému?
  • Jaké nástroje používáte pro monitorování a správu clusterů?
  • Jak byste řešili problém s pomalým výkonem dotazů v Hive?
  • Jaké jsou vaše zkušenosti s cloudovými platformami?
  • Jak byste zajistili bezpečnost dat v Hadoop clusteru?
  • Jaké skriptovací jazyky používáte pro automatizaci správy systému?
  • Jaké jsou vaše zkušenosti s databázemi a SQL?