Esto no es un problema trivial. Dependiendo de cuál sea exactamente su objetivo final y los recursos a su disposición, podría haber una serie de enfoques diferentes.
Las IMU (unidades de medición inercial), unidades de sensores con aceleradores, giroscopios y, a veces, magnetómetros, no serán suficientes para determinar con precisión las posiciones relativas de la muñeca y los zapatos. Te darán mucha información sobre motion pero si intentas deducir la posición de esa información, el error se acumulará y obtendrás una deriva inevitable.
El GPS normal no es una buena idea para algo a pequeña escala (como se sugiere en un comentario de pregunta) ya que simplemente no será lo suficientemente preciso. GPS diferencial es un poco mejor allí pero puede ser completamente inadecuado para su aplicación y puede encontrar que no vale la pena. De manera similar, la mayoría de los enfoques de RF fluctuarán en gran medida en la precisión simplemente en función de cómo se encuentre una persona o dónde haya paredes. Esas son todas soluciones de largo alcance.
Una vez más, dependiendo de su aplicación (¿en interiores, en exteriores, en áreas extensas?), su mejor opción probablemente sea un enfoque de visión artificial. Hay captura de movimiento donde adjunta marcadores a las partes que desea rastrear y coloca las cámaras en tantos ángulos como sea posible, de manera que La mayor cantidad posible siempre tiene una vista que no esté ocluida de estos marcadores. Con esas secuencias de video y algunos cálculos matemáticos, puede realizar un seguimiento muy preciso de las posiciones de los marcadores. Esto se hace en la industria del cine, por ejemplo, para obtener datos de movimiento para CGI.
De lo contrario, siempre podría tomar un Kinect y arreglárselas con los datos que le proporciona (lo que podría ser mejor que adjuntar IMU) e incluso fusionar esos datos con un método de seguimiento diferente.